Нейросеть научилась отличать отличников от двоечников по постам в соцсетях
Ученые из РФ создали нейросеть, которая по содержанию и оформлению постов в социальных сетях может отличать грамотных людей от тех, кто плохо учился в школе. Отличники вставляют иностранные слова, а двоечники — смайлы.
Российские ученые представили алгоритм, умеющий анализировать сообщения в соцсетях и определять, кто их написал – отличник или двоечник. Специалисты утверждают, что точность составляет 94%, пишет EPJ Data Science.
Исследователи предоставили для изучения нейросети посты в Twitter и ВКонтакте.
«Наша модель с точностью до 94% выявляла учащихся с высокой и низкой успеваемостью… Такой подход может быть полезен и для выявления депрессии, влияющей на учебные достижения», — заявил автор работы, заведующий лабораторией вычислительных социальных наук Института образования НИУ ВШЭ Иван Смирнов.
Ученый и его коллеги собрали и изучили сообщения, которые на своих страницах в ВКонтакте написали примерно 2,4 тысячи подростков, проходивших в 2012 году специальный тест на оценку грамотности и способности применять знания на практике.
Материал был предоставлен для тренировки нейросетям, которые проанализировали смысловое содержание и стилистику сообщений и сопоставили их с типичным уровнем образования и успеваемости людей, для которых характерны подобные интересы, знания и стиль написания.
В итоге нейросеть научилась довольно точно определять двоечников и отличников.
Отмечается, что отличникам характерны длинные тексты, связанные с литературой, физикой и описанием мыслительных процессов. Их сообщения богаты лексиконом и в них присутствуют иностранные слова.
А вот двоечники «удобряли» свои тексты в основном смайлами и словами, написанными заглавными буквами. Также эта категория пользователей сети чаще всего обсуждала гороскопы, ДТП и службу в армии.
«Наши результаты показали, насколько уязвима конфиденциальность пользователя в социальной сети. Люди переживают из-за вездесущих камер и систем распознавания лиц, однако, даже /…/ короткий текст, может стать источником информации, которую человек не собирался раскрывать», — резюмировали специалисты.