Los investigadores han desarrollado una IA para detectar clickbait junto con titulares escritos por máquinas.
Hay muchos problemas a los que se enfrentan los informes hoy en día, incluidas noticias falsas, verdades alternativas, falta general de precisión objetiva, manipulación estatal, contenido falso, encarcelamiento de periodistas y esos molestos titulares engañosos que llamamos clickbait.
Muchos de nosotros afirmamos que no nos enamoramos de clickbait, pero la mayoría de nosotros habremos hecho clic en uno en algún momento. El titular suele ser algo así como "¡No creerías cómo se ve el bebé Teletubbies ahora!" (Sí, está bien, me enamoré de eso vergonzosamente recientemente).
Los investigadores de Penn State y la Universidad Estatal de Arizona le encargaron a un grupo de humanos que escribieran su propio clickbait. Las máquinas se programaron para escribir titulares artificiales de clickbait. Estos datos se usaron para entrenar un algoritmo para detectar clickbait escrito por personas o máquinas.
Los investigadores afirman que su algoritmo de detección de clickbait es aproximadamente un 14,5 por ciento más preciso que otros sistemas. Más allá de su uso para detectar clickbait, los investigadores afirman que sus datos pueden ayudar a mejorar el rendimiento de otras IA.
Dongwon Lee, investigador principal del proyecto y profesor asociado en la Facultad de Ciencias de la Información y Tecnología, dijo:
“Este resultado es bastante interesante, ya que demostramos con éxito que los datos de entrenamiento de clickbait generados por máquina pueden retroalimentarse en la tubería de entrenamiento para entrenar a una amplia variedad de modelos de aprendizaje automático para mejorar el rendimiento.
Este es un paso para abordar el cuello de botella fundamental del aprendizaje automático supervisado que requiere una gran cantidad de datos de capacitación de alta calidad ".
Un problema que enfrentaron los investigadores es la gran variedad de clickbait disponibles y la necesidad de que se etiquete como tal para capacitar al modelo.
Shyam Sundar, profesor de comunicaciones en la Universidad Penn State y otro autor del informe, explica:
“Hay clickbaits que son listas o listas; hay clickbaits que se expresan como preguntas; hay algunos que comienzan con quién-qué-dónde-cuándo; y todo tipo de otras variaciones de clickbait que hemos identificado en nuestra investigación a lo largo de los años.
Por lo tanto, encontrar suficientes muestras de todos estos tipos de clickbait es un desafío. A pesar de que todos nos lamentamos por la cantidad de clickbaits, cuando se llega a obtenerlos y etiquetarlos, no hay muchos de esos conjuntos de datos ".
Se reclutaron 125 estudiantes de periodismo y 85 trabajadores de Amazon Turk para suministrar el clickbait escrito por humanos para la investigación. Los reclutas tuvieron la tarea de leer artículos cortos de 500 palabras y luego escribir un titular de clickbait para cada uno.
Las IA como la desarrollada por los investigadores de Penn State y de la Universidad Estatal de Arizona podrían algún día ser esenciales para combatir las amenazas al periodismo que tienen un efecto negativo sobre las libertades y libertades que apreciamos.
Puedes encontrar una copia del trabajo de investigación completo aquí (PDF)
¿Interesado en escuchar a líderes de la industria discutir temas como este? Asista a la 5G Expo, IoT Tech Expo, Blockchain Expo, AI & Big Data Expo y Cyber Security & Cloud Expo World Series con eventos próximos en Silicon Valley, Londres y Amsterdam.