Categories: IANoticias

MIT ha eliminado un conjunto de datos que conduce a modelos de AI misóginos y racistas

El MIT se disculpó y se desconectó de un conjunto de datos que entrena modelos de IA con tendencias misóginas y racistas.

El conjunto de datos en cuestión se llama 80 Million Tiny Images y fue creado en 2008. Diseñado para entrenar a las IA para detectar objetos, el conjunto de datos es una gran colección de imágenes que se etiquetan individualmente en función de lo que presentan.

Los modelos de aprendizaje automático se entrenan con estas imágenes y sus etiquetas. Una imagen de una calle, cuando se alimenta a una IA entrenada en un conjunto de datos de este tipo, podría informarle sobre cosas que contiene, como automóviles, farolas, peatones y bicicletas.

Dos investigadores, Vinay Prabhu, científico jefe de UnifyID, y Abeba Birhane, candidato a doctorado en el University College de Dublín en Irlanda, analizaron las imágenes y encontraron miles de etiquetas preocupantes.

Se descubrió que el conjunto de capacitación del MIT etiquetaba a las mujeres como "perras" o "prostitutas" y personas de las comunidades BAME con el tipo de términos despectivos que estoy seguro de que no necesitan que escriba. El Registro señala que el conjunto de datos también contenía imágenes de primer plano de genitales femeninos etiquetados con la palabra C.

El Registro alertó al MIT sobre los problemas preocupantes encontrados por Prabhu y Birhane con el conjunto de datos y la universidad rápidamente lo desconectó. MIT dio un paso más e instó a cualquiera que use el conjunto de datos a dejar de usarlo y eliminar cualquier copia.

Una declaración en el sitio web del MIT afirma que desconocía las etiquetas ofensivas y que eran "una consecuencia del procedimiento automatizado de recopilación de datos que se basaba en nombres de WordNet".

La declaración continúa explicando los 80 millones de imágenes contenidas en el conjunto de datos, con tamaños de solo 32 × 32 píxeles, lo que significa que la inspección manual sería casi imposible y no puede garantizar que se eliminarán todas las imágenes ofensivas.

“Los prejuicios, las imágenes ofensivas y perjudiciales, y la terminología despectiva enajenan a una parte importante de nuestra comunidad, precisamente aquellos a los que nos estamos esforzando por incluir. También contribuye a los prejuicios perjudiciales en los sistemas de IA entrenados en tales datos ", escribieron Antonio Torralba, Rob Fergus y Bill Freeman del MIT.

“Además, la presencia de imágenes tan perjudiciales perjudica los esfuerzos para fomentar una cultura de inclusión en la comunidad de visión por computadora. Esto es extremadamente desafortunado y va en contra de los valores que nos esforzamos por mantener ".

Puede encontrar una copia preimpresa completa del documento de Prabhu y Birhane aquí (PDF)

(Foto de Clay Banks en Unsplash)

¿Interesado en escuchar a líderes de la industria discutir temas como este? Asista a la 5G Expo, IoT Tech Expo, Blockchain Expo, AI & Big Data Expo y Cyber ​​Security & Cloud Expo World Series con eventos próximos en Silicon Valley, Londres y Amsterdam.

Etiquetas: ai, modelo ai, inteligencia artificial, conjunto de datos, igualdad, Destacado, aprendizaje automático, misógino, mit, racismo, racista, capacitación

Erica Flores

Enamorada de la tecnología. Apasionada de la velocidad que la información puede adquirir en este mundo cambiante. Actualmente residiendo en Barcelona.

Recent Posts

Uber utilizará la eSIM de Valid para casos de uso de IoT

Uber está mejorando sus implementaciones de IoT en todo el mundo mediante la adopción de…

3 years ago

Matter Motor Works se asocia con Airtel para habilitar sus bicicletas AERA con soluciones IoT

Obras de motor de materia y Bharti Airtel, un proveedor de servicios de telecomunicaciones ha…

3 years ago

Escultura de Zelda Guardian rastrea a humanos y mascotas a través de una cámara

En The Legend of Zelda: Breath of the Wild, los guardianes son una forma primitiva…

3 years ago

Nos encanta este diminuto Wall-E controlado por radio

Muchos de nosotros nos enamoramos absolutamente de Wall-E, el personaje principal de una…

3 years ago

Serie Samsung Galaxy S24: fecha de lanzamiento, especificaciones, precio y todos los rumores hasta ahora

Dhruv Bhutani / Android AuthorityCada año, los fanáticos de los teléfonos inteligentes esperan con ansias…

3 years ago

Final Cut Pro para iPad: fecha de lanzamiento, características, compatibilidad, precio

Apple ha anunciado que Final Cut Pro finalmente llegará para el iPad. Tras años de…

3 years ago