спасибо.
registered 244--откуда столько, вроде все отчеты поудаляла
Вы делаете много расследований, а значит постоянно пишите про разных юзеров и когда они зарегистрировались.
Там парсятся все слова, а не только те которые имеют к вам непосредственное отношение
ага если сложить склонения и русский английский около 300 получается
Можно запилить учет склонения и иных возможных вариаций... В принципе, простейший вариант - проходим по построенному списку и пробуем укорачивать слово, пока не найдутся совпадения, при которых записи объединяем. Тогда списки станут покороче и проще для понимания, можно будет поставить процесс на поток.
Самая мякотка это было бы запилить удлиннение анализируемых кусков - до фраз. Многие пользователи с альтами погорели бы на этом
Как тот же биопен со своим Спинозой (фраза была написана всего на 2-х сайтах во всем мире и с 3-х аккаунтов которые все принадлежали биоену).
Кстати, в порядке стеба, можно ещё взять эту штуку:
https://www.npmjs.com/package/node-nlpДалее скармливать ей последовательно содержимое всех постов юзера в порядке "цитата из поста + его ответ". По итогу должен получиться конфиг, который на произвольные скормленные фразы будет отвечать подобно юзеру, на основе постов которого он был сделан. Отличный рецепт для автоматизированной пародии на того, кого хочется затроллить.
жду момента когда на форуме нейросети начнут писать и выбиваться по меритам/доверию в лидеры.
Чтобы "создать" типичного баунтиста, например, даже нейросеть не нужна - обычного скрипта хватит: парсить баунти кампании, писать посты типа join/proof of authentication и фигачить баунти отчеты