Yo lo pienso primero: etiquetador de fotos y visor inteligente
(Perdón por la extensión de la entrada, es que me he entusiasmado un poco...)
Trasteando con la Wii he probado el visor de fotos que trae; he tenido que poner una tarjeta SD de la cámara antigua (la nueva va con CF) donde tenía fotos del viaje a Italia de hace ya unos cuantos años. Pensé que debería organizar las fotos de los viajes y subirlas al Picasa (entre otras las del último viaje de buceo a Roatán el mes pasado) y se me ocurrió algo que podría ser interesante: un "etiquetador" de fotos (una de las tareas más tediosas de la organización de fotos)
Todos los turistas hacemos las mismas fotos: la torre Eiffel, el Panteón, el Palacio de Oriente... y seguro que desde ángulos muy parecidos. Usando las etiquetas que otros hayan puesto a fotos similares, se podrían etiquetar automáticamente u ofrecer una lista de etiquetas o cosa parecida.
Según lo veo, lo jodido reside en dos puntos (no por orden de importancia):
1) Disponer de suficientes fotos etiquetadas. Ojo al idioma. Deben ser suficientes para deshechar las etiquetas no similares.
2) Analizar semejanzas entre la foto a etiquetar y la base de datos, que tendría que almacenar algo así como un "patrón base" de cada etiqueta o algo similar.
Una idea para el punto 1 sería hacer lo contrario: en vez de buscar fotos CON etiquetas, buscar fotos PARA las etiquetas. Es decir, crear previamente una lista de lugares turísticos y crear un "patrón" (punto 2) según las fotos halladas en google, por ejemplo. El problema de ese sistema es que asociaría fotos profesionales, no sólo las fotos de turistas (que son las que realmente se parecerán enormemente) y habría que deshechar fotos no directamente relacionadas (si ponéis "Palacio de Oriente" salen entre las primeras fotos las de manifestaciones y discursos de Franco) pero puede ser un comienzo.
Para el punto 2 la cosa se complica ¿cómo decir que el objeto de una foto es X% parecido a otro? (puede haber distintos ángulos, iluminaciones, coloración, ...) Y aunque se hiciera bien ¿cómo resolver que A se parece a B, pero B se parece a C y C se parece a D, etc. (es decir, los parecidos "cruzados")? supongo que se resolvería bastante aumentando el nivel mínimo de parecido, pero entonces se complica más el problema anterior: distintos ángulos, ilumincaciones,... Y aunque se resolviera: ¿cómo comparar eficientemente el parecido con un montón de lugares (si tarda en etiquetar una foto tres días casi que no merece la pena)? quizá sea lo más fácil de resolver: no hay tantos lugares turísticos comunes y de todas formas se puede hacer algún tipo de análisis de baja resolución o limitar la búsqueda a un país o algo así.
En fin, una ocurrencia como otra cualquiera. La idea es parte de otra paja mental más general (ya os digo, usando el visor de la Wii): un visor de fotos que, automáticamente según te las enseña, las etiquete, busque y elimine los ojos rojos, analice el tipo de foto (líneas verticales -edificios-, horizontales -paisajes-, ...) y haga una presentación acorde a lo analizado (los visores suelen "mover" lentamente las fotos que es más agradable a que estén quietas, pero a veces las mueven en sentidos poco apropiados) o incluso que rote automáticamente la foto si está tomada verticalmente. E incluso que ponga una música apropiada (se podría hacer con música folclórica según el país)
Gran parte de esas cosas las hace una "persona humana" sin grandes alaracas, pero el cerebro está muy especializado en hacer esos análisis, creo que no sería cosa sencilla imitarlo (en particular, al problema de encontrar y analizar caras hace tiempo que le están dando vueltas).
Pero algunas cosas puede que sí sean sencillas: estoy seguro de que un "rotador automático" simplón acertaría un montón de veces, simplemente analizando masas de color azul que suelen ir en la parte superior (el cielo, claro). Por supuesto que en alguna ocasión fallaría: una foto horizontal de un billete de 20 euros, la pondría vertical pensando que la parte azul es el cielo. Pero creo que sería lo suficientemente exacto como para que mereciera la pena incluirlo entre las herramientas del Picasa, por ejemplo.
Bueno, no sé si sería posible o no, pero sí sería un bombazo. Imagináos: subir las fotos a la web y que el visor te haga, él solito, una presentación con los nombres de los lugares, con las fotos bien rotadas, modificadas y hasta mejoradas, con su música apropiada, ... en fin, que sería una forma de sacarle partido a las quinientas mil fotos que sacamos con las cámaras digitales (salen grátis) y luego nunca volvemos a ver. Hasta podría eliminar de la presentación las fotos similares y dejar las mejores. Y si ya elimina las fotos donde sale la suegra, sería un éxito seguro ;)
Actualizado: qué curioso, buscando fotos en google del gran cañón para ver si saldría bien ertratado ese lugar turístico (los paisajes serían más complicados que los edificios, claro), navegué hasta un blog que curioseé y que en una de sus entradas -sin relación alguno con lo anterior- hacía referencia al reconocimiento de caras
Trasteando con la Wii he probado el visor de fotos que trae; he tenido que poner una tarjeta SD de la cámara antigua (la nueva va con CF) donde tenía fotos del viaje a Italia de hace ya unos cuantos años. Pensé que debería organizar las fotos de los viajes y subirlas al Picasa (entre otras las del último viaje de buceo a Roatán el mes pasado) y se me ocurrió algo que podría ser interesante: un "etiquetador" de fotos (una de las tareas más tediosas de la organización de fotos)
Todos los turistas hacemos las mismas fotos: la torre Eiffel, el Panteón, el Palacio de Oriente... y seguro que desde ángulos muy parecidos. Usando las etiquetas que otros hayan puesto a fotos similares, se podrían etiquetar automáticamente u ofrecer una lista de etiquetas o cosa parecida.
Según lo veo, lo jodido reside en dos puntos (no por orden de importancia):
1) Disponer de suficientes fotos etiquetadas. Ojo al idioma. Deben ser suficientes para deshechar las etiquetas no similares.
2) Analizar semejanzas entre la foto a etiquetar y la base de datos, que tendría que almacenar algo así como un "patrón base" de cada etiqueta o algo similar.
Una idea para el punto 1 sería hacer lo contrario: en vez de buscar fotos CON etiquetas, buscar fotos PARA las etiquetas. Es decir, crear previamente una lista de lugares turísticos y crear un "patrón" (punto 2) según las fotos halladas en google, por ejemplo. El problema de ese sistema es que asociaría fotos profesionales, no sólo las fotos de turistas (que son las que realmente se parecerán enormemente) y habría que deshechar fotos no directamente relacionadas (si ponéis "Palacio de Oriente" salen entre las primeras fotos las de manifestaciones y discursos de Franco) pero puede ser un comienzo.
Para el punto 2 la cosa se complica ¿cómo decir que el objeto de una foto es X% parecido a otro? (puede haber distintos ángulos, iluminaciones, coloración, ...) Y aunque se hiciera bien ¿cómo resolver que A se parece a B, pero B se parece a C y C se parece a D, etc. (es decir, los parecidos "cruzados")? supongo que se resolvería bastante aumentando el nivel mínimo de parecido, pero entonces se complica más el problema anterior: distintos ángulos, ilumincaciones,... Y aunque se resolviera: ¿cómo comparar eficientemente el parecido con un montón de lugares (si tarda en etiquetar una foto tres días casi que no merece la pena)? quizá sea lo más fácil de resolver: no hay tantos lugares turísticos comunes y de todas formas se puede hacer algún tipo de análisis de baja resolución o limitar la búsqueda a un país o algo así.
En fin, una ocurrencia como otra cualquiera. La idea es parte de otra paja mental más general (ya os digo, usando el visor de la Wii): un visor de fotos que, automáticamente según te las enseña, las etiquete, busque y elimine los ojos rojos, analice el tipo de foto (líneas verticales -edificios-, horizontales -paisajes-, ...) y haga una presentación acorde a lo analizado (los visores suelen "mover" lentamente las fotos que es más agradable a que estén quietas, pero a veces las mueven en sentidos poco apropiados) o incluso que rote automáticamente la foto si está tomada verticalmente. E incluso que ponga una música apropiada (se podría hacer con música folclórica según el país)
Gran parte de esas cosas las hace una "persona humana" sin grandes alaracas, pero el cerebro está muy especializado en hacer esos análisis, creo que no sería cosa sencilla imitarlo (en particular, al problema de encontrar y analizar caras hace tiempo que le están dando vueltas).
Pero algunas cosas puede que sí sean sencillas: estoy seguro de que un "rotador automático" simplón acertaría un montón de veces, simplemente analizando masas de color azul que suelen ir en la parte superior (el cielo, claro). Por supuesto que en alguna ocasión fallaría: una foto horizontal de un billete de 20 euros, la pondría vertical pensando que la parte azul es el cielo. Pero creo que sería lo suficientemente exacto como para que mereciera la pena incluirlo entre las herramientas del Picasa, por ejemplo.
Bueno, no sé si sería posible o no, pero sí sería un bombazo. Imagináos: subir las fotos a la web y que el visor te haga, él solito, una presentación con los nombres de los lugares, con las fotos bien rotadas, modificadas y hasta mejoradas, con su música apropiada, ... en fin, que sería una forma de sacarle partido a las quinientas mil fotos que sacamos con las cámaras digitales (salen grátis) y luego nunca volvemos a ver. Hasta podría eliminar de la presentación las fotos similares y dejar las mejores. Y si ya elimina las fotos donde sale la suegra, sería un éxito seguro ;)
Actualizado: qué curioso, buscando fotos en google del gran cañón para ver si saldría bien ertratado ese lugar turístico (los paisajes serían más complicados que los edificios, claro), navegué hasta un blog que curioseé y que en una de sus entradas -sin relación alguno con lo anterior- hacía referencia al reconocimiento de caras
Comentarios
¿Y que me dices de un buscador que te encuentre música que tu le tarareas? eso si que molaría, ¿eh?