SDK Kinect for Dummies-2

De Fernando - septiembre 24, 2012

Después de un tiempo he decidido continuar con las entradas del SDK de Kinect. En la primera entrada veíamos como mostrar la cámara RGB. También podemos ver una charla de introducción al Kinect SDK. En esta ocasión explicaré paso a paso como mostrar el DepthStream.

Veremos dos formas de pintar nuestro DepthStream. En el primer caso pintaremos directamente la intensidad y en el segundo caso al detectar un usuario pintaremos su silueta de un color.

Antes de comenzar vamos a ver las fórmulas para obtener la distancia y el índice del usuario:

- Distancia: int depth = depthPoint >> DepthImageFrame.PlayerIndexBitmaskWidth;

- Usuario/jugador: int player = depthPoint & DepthImageFrame.PlayerIndexBitmask;

En el caso del usuario debemos saber que hay que habilitar el SkeletonStream, aunque aún no hablemos de Skeleton.

Pintar DepthStream:

Comenzaremos como en la anterior entrada buscando nuestro sensor Kinect. En este caso lo realizaremos de una forma diferente.

 
 foreach (var potentialSensor in KinectSensor.KinectSensors)
            {
                if (potentialSensor.Status == KinectStatus.Connected)
                {
                    this.miKinect = potentialSensor;
                    break;
                }
            }

Recorremos la colección de sensores y nos quedaremos con el primer sensor que encontremos conectado.

Una vez obtenido el sensor pasaremos a activar los Streams y encender el sensor. En mi caso esto lo realizo al cargar la ventana. Además debemos agregar el control del evento, se puede controlar mediante AllFramesReady, este evento se ejecuta una vez que están listos todos los Frames de los stream que estén activos. En este caso gestionaremos el evento DepthFrameReady que tan solo tenemos que esperar a los DepthFrame. IMPORTANTE: en el evento de cierre de la ventana debemos parar nuestro sensor.

if (this.miKinect != null)
            {

                // Habilitamos la cámara elegiendo el formato de imagen.
                miKinect.DepthStream.Enable(DepthImageFormat.Resolution640x480Fps30);

                miKinect.SkeletonStream.Enable();
                
                this.depthPixels = new short[this.miKinect.DepthStream.FramePixelDataLength];

                this.colorPixels = new byte[this.miKinect.DepthStream.FramePixelDataLength * sizeof(int)];
                // Arrancamos Kinect.
                miKinect.Start();
                // Nos suscribimos al método
                miKinect.DepthFrameReady += DepthImageReady;
            }

A continuación vemos la gestión del evento. En este evento emplearemos las anteriores formulas para pintar. En un principio usaremos la distancia junto con una mascara de bytes para poder pintar en función de esta. En este caso tenemos del DepthFrame un array de 'short' en lugar de un array de 'bytes'. Es sobre los puntos de este array de short sobre los que se debe aplicar las fórmulas. Una vez abierto el frame y obtenida la distancia le aplicamos una mascara para poder obtener la intensidad. Para pintarlo necesitamos un array de bytes de 4 veces el tamaño del array de short. Esto es por las componentes RGB más la componente alfa del RGB, sin embargo solo pintaremos en las posiciones RGB. Por último pintamos el array de bytes en un bitmap.Veamos:

 private void DepthImageReady(object sender, DepthImageFrameReadyEventArgs e)
        {
            using (DepthImageFrame depthFrame = e.OpenDepthImageFrame())
            {
                // Si este es null no continuamos
                if (depthFrame == null) return;
                // Creamos un array de bytes del tamaño de los pixel del frame.
               // byte[] pixels = new byte[depthFrame.PixelDataLength];
                // Copiamos los datos del frame de profundidad.
                depthFrame.CopyPixelDataTo(this.depthPixels);
                // Creamos un nuevo mapa de bits en el que podamos escribir
                this.colorBitmap = new WriteableBitmap(this.miKinect.DepthStream.FrameWidth, this.miKinect.DepthStream.FrameHeight,
                    96.0, 96.0, PixelFormats.Bgr32, null);
                
                // PINTAMOS
                int colorPixelIndex = 0;
                for (int i = 0; i < this.depthPixels.Length; ++i)
                {
                    
                    // discard the portion of the depth that contains only the player index
                    short depth = (short)(this.depthPixels[i] >> DepthImageFrame.PlayerIndexBitmaskWidth);

                    // to convert to a byte we're looking at only the lower 8 bits
                    // by discarding the most significant rather than least significant data
                    // we're preserving detail, although the intensity will "wrap"
                    byte intensity = (byte)(depth & byte.MaxValue);

                        // Write out blue byte
                        this.colorPixels[colorPixelIndex++] = intensity;

                        // Write out green byte
                        this.colorPixels[colorPixelIndex++] = intensity;

                        // Write out red byte                        
                        this.colorPixels[colorPixelIndex++] = intensity;

                    // We're outputting BGR, the last byte in the 32 bits is unused so skip it
                    // If we were outputting BGRA, we would write alpha here.
                    ++colorPixelIndex;
                }

                // Pintar con color a los usuarios
                //ConvertDepthFrame(this.depthPixels, ((KinectSensor)sender).DepthStream, ref this.colorPixels);

                this.colorBitmap.WritePixels(
                   new Int32Rect(0, 0, this.colorBitmap.PixelWidth, this.colorBitmap.PixelHeight),
                   this.colorPixels,
                   this.colorBitmap.PixelWidth * sizeof(int),
                   0);

                imageKinect.Source = this.colorBitmap;


            }
        }

Resultado:

A continuación vamos a ver una función que nos ayuda a pintar al usuario de un color. En esta función usamos los valores por defecto de distancia de kinect: demasiado cerca, demasiado lejos, desconocido. Cada una de estas distancias se pintara de un color. En el resto de los casos usaremos la variable de "jugador" para una mascara que dará color a los usuarios. El jugador/usuario servirá como índice del array. Veamos los valores de los array de la mascara:

// color divisors for tinting depth pixels
        private static readonly int[] IntensityShiftByPlayerR = { 1, 2, 0, 2, 0, 0, 2, 0 };
        private static readonly int[] IntensityShiftByPlayerG = { 1, 2, 2, 0, 2, 0, 0, 1 };
        private static readonly int[] IntensityShiftByPlayerB = { 1, 0, 2, 2, 0, 2, 0, 2 };

Veamos el método de pintado.

// Converts a 16-bit grayscale depth frame which includes player indexes into a 32-bit frame
        // that displays different players in different colors
        private void ConvertDepthFrame(short[] depthFrame, DepthImageStream depthStream,ref byte[] depthFrame32)
        {
            int tooNearDepth = depthStream.TooNearDepth;
            int tooFarDepth = depthStream.TooFarDepth;
            int unknownDepth = depthStream.UnknownDepth;

            // Test that the buffer lengths are appropriately correlated, which allows us to use only one
            // value as the loop condition.
            if ((depthFrame.Length * 4) != depthFrame32.Length)
            {
                throw new InvalidOperationException();
            }

            int colorPixelIndex = 0;
            for (int i16 = 0; i16 < depthFrame.Length; i16++)
            {
                int player = depthFrame[i16] & DepthImageFrame.PlayerIndexBitmask;
                int realDepth = depthFrame[i16] >> DepthImageFrame.PlayerIndexBitmaskWidth;

                if (player == 0 && realDepth == tooNearDepth)
                {
                    // white 
                    depthFrame32[colorPixelIndex++] = 255;
                    depthFrame32[colorPixelIndex++] = 255;
                    depthFrame32[colorPixelIndex++] = 255;
                }
                else if (player == 0 && realDepth == tooFarDepth)
                {
                    // dark purple
                    depthFrame32[colorPixelIndex++] = 66;
                    depthFrame32[colorPixelIndex++] = 0;
                    depthFrame32[colorPixelIndex++] = 66;
                }
                else if (player == 0 && realDepth == unknownDepth)
                {
                    // dark brown
                    depthFrame32[colorPixelIndex++] = 66;
                    depthFrame32[colorPixelIndex++] = 66;
                    depthFrame32[colorPixelIndex++] = 33;
                }
                else
                {
                    // transform 13-bit depth information into an 8-bit intensity appropriate
                    // for display (we disregard information in most significant bit)
                    byte intensity = (byte)(~(realDepth >> 4));

                    // tint the intensity by dividing by per-player values
                    depthFrame32[colorPixelIndex++] = (byte)(intensity >> IntensityShiftByPlayerR[player]);
                    depthFrame32[colorPixelIndex++] = (byte)(intensity >> IntensityShiftByPlayerG[player]);
                    depthFrame32[colorPixelIndex++] = (byte)(intensity >> IntensityShiftByPlayerB[player]);
                }
                ++colorPixelIndex;
            }
        }

Resultado:

Enlace con el código: http://sdrv.ms/Q2pwO1

NOTA: Está compilado con la versión 2012 de Visual Studio.

Comentarios

monicatorrellas30 de septiembre de 2012, 20:09
Hola! Soy una estudiante y estoy intentando calcular las distancias con la camera kinect, estoy empezando en este mundillo y me vendría muy bien un poco de ayuda. Sobre todo me interesa que me aparezcan las distancias en la pantalla.

Muchisimas Gracias
ResponderEliminar
Respuestas
Anónimo16 de enero de 2013, 15:01
Hola, estoy aprendiendo a programar con Kinect y quería preguntar si sabeis cómo se haría para mover el cursor utilizando kinect y no tener que utilizar el ratón. Gracias.
ResponderEliminar
Respuestas
Anónimo29 de enero de 2013, 17:33
Hola, una vez que activamos el skeleton: mikinect.SkeletonStream.Enable(); para guardar un skeleton hago SkeletonFrame skeleton = mikinect.ColorFrame Ready(); pero no es correcto, quiero obtener el esqueleton para luego sacar x,y de algún punto (mano,cabeza). ¿Cómo se haría? Muchas gracias.
ResponderEliminar
Respuestas
Fernando30 de enero de 2013, 12:56
Hola,el caso del skeleton es especial. Preparo una entrada explicando como pintarlo =). Mientras puede ir viendo ejemplos de otras personas acerca de como pintarlo: http://elbruno.com/2011/11/11/kinect-howto-pintar-un-skeleton-en-wpf/
ResponderEliminar
Respuestas
Anónimo7 de febrero de 2013, 19:15
Hola que tal? estoy aprendiendo a programar con Kinect para un proyecto de la escuela, sabes si hay algun algoritmo para la deteccion del piso o calcular la distancia de algun punto especifico del piso?
Gracias!! btw muy buen post!
ResponderEliminar
Respuestas
Anónimo13 de febrero de 2013, 10:39
Saludos
Estimado soy estudiante y estoy realizando mi tesis y viendo el video de magia cyber de TED, me dio la idea de realizar algo parecido, pero referente al cuerpo humano, recien estoy empapandome de la kinect, por lo cual necesito saber primero si se puede hacer y segundo una guia por donde empezar, el proyecto trata de que un estudiante podra visualizar un cuerpo humano (por medio del proyector) y el por medio de la kinect podra explorar el mismo (quitar las capas, zoom in zoom out, girar las partes)imagino q esto al igual q el video de TED, lo debo realizar por medio de animacion en 3d y flash?? pregunta debo usar otra camara parte de la kinect?? asi km aparece en el video de TED, y otra si se podra fusinar todo??? ayudame con estas inquietudes y sugerencias porfa, deseo saber si se puede antes de invertir en la compra de los dispositivos y la figuras de 3d y animacion??
ResponderEliminar
Respuestas
Fernando13 de febrero de 2013, 10:52
Buenos días,
no he visto el vídeo que comentas. Dejame el link y lo veo.

Mediante kinect podría detectar gestos de zoom, de giro, o para quitar capas. La parte de la animación no la conozco mucho (no me he puesto nunca ha ello).

En cuanto a Kinect ahora mismo estoy leyendo un libro que aborda el tratamiento de gestos simples, posturas y gestos más complejos. Yo he comprado el libro, si no estas seguro de que vas a usar kinect intenta buscar algún libro gratuito que hable de ello.

El libro es: Programming with the KinectTM for Windows® Software Development Kit: Add gesture and posture recognition to your applications

https://www.amazon.es/gp/product/B009AITHPC/ref=kinw_myk_ro_title

Gracias por tu comentario y espero haberte servido de ayuda.
ResponderEliminar
Respuestas
Rodrigo Romero16 de mayo de 2013, 7:54
Como hacer Domotica con Kinect y Arduino... hacer que sensor simplemente sienta la presencia de la persona y poder encender las luces y cuando no sienta la presencia de la persona apagar las luces.
ResponderEliminar
Respuestas
Unknown24 de mayo de 2013, 4:36
al igual que muchos estoy aprendiendo a programar en kinect para un proyecto de escuela, y consiste en poder apagar una luz con una seña o encenderla de misma forma de casualidad, ¿tendrias una programacion parecida?
ResponderEliminar
Respuestas
Anónimo1 de septiembre de 2013, 2:48
alguien sabe como obtener el color de un pixel en especifico?
ResponderEliminar
Respuestas

Añadir comentario

Buscar este blog

Programación para Estudiantes

SDK Kinect for Dummies-2

Comentarios

Publicar un comentario

Entradas populares de este blog

Google Maps - Windows Form

Procesos Linux - exec y fork

Función __doPostBack