Twitteraudit - алгоритм распознавания ботов?

Gagarin1

newbie

Activity: 39

Merit: 0

Нашел информацию по работе аналога Twitteraudit - Fakefollowers. Fakefollowers определяет ботов по нескольким критериям.

1. число фолловеров — соотношение 50:1 и более (т.е. профиль подписан на 50 аккаунтов, а у самого всего лишь 1 фолловер),
2. более 30% твитов содержать спам-слова (диеты, заработок, работа на дому и т.д.),
3. повтор одних и тех же твитов более трех раз,
4. 90% твитов аккаунта — ретвиты,
5. 90% твитов аккаунта — ссылки,
6. аккаунт никогда не публиковал твиты,
7. аккаунт создан более двух месяцев назад, но в аватаре профиля по-прежнему стоит картинка по умолчанию,
8. в аккаунте нет никакой информации о пользователе, но при этом он подписан на 100+ профилей.

Каждому из критериев, перечисленных выше, дается определенное количество баллов, и как только они достигают определенной отметки, аккаунт считается подозрительным.

Помимо подозрительных аккаунтов система ищет неактивных пользователей на основании двух критериев:

аккаунт опубликовал менее трех твитов,
последний твит был опубликован более 90 дней назад.
Остальных пользователей система относит к «хорошим».

Думаю подобные алгоритмы использует и Twitteraudit.

iesod

newbie

Activity: 182

Merit: 0

Quote from: Jeex on January 08, 2018, 09:25:10 PM

Есть много сервисов, как например Twitteraudit, которые распознают ботов среди подписчиков. Хотелось бы узнать, на основании чего Twitteraudit определяет, что этот аккаунт - бот, а другой - человек? Т.е. хотелось бы выяснить алгоритм распознавания ботов.

Боюсь что алгоритм распознования ботов сервисом, коммерческая тайна (площадка то коммерческая) и соответственно реальную инфу получить будет очень затруднительно...
Не буду удивлен если подобные сервисы используют для таких целей искуственный интелект и нейросети...

Gagarin1

newbie

Activity: 39

Merit: 0

Тоже очень интересно знать алгоритм работы, или понимать какими методами нельзя раскручивать свой аккаунт Twitter, чтобы алгоритм его не записал в боты.

Joker007

newbie

Activity: 84

Merit: 0

Большинство ботов ведут себе одинаково, кроме частоты постинга айпишников есть поведенческие факторы которые под которые гораздо сложнее подстраивать ботов

SoftBlocks

newbie

Activity: 65

Merit: 0

Quote from: ?? on ??

Редкое и низкое количество твитов, отсутствие аватарки, сумма подписок и подписчиков.
Может быть дата регистрации еще как-то влияет.

с точки зрения программирования ботов это не так:
1. число твитов легко сделать любым
2. аватарка опять таки это одна команда. случайно дергается картинка и гугл поиска, обрабатывается и делается аватаркой
3. с числом фолловеров сложнее, но опять таки - проходишь роботом по тем кто взаимный фоловинг и смотришь дробь "сколько людей читают Васю/ Сколько людей читает вася"
. если дробь порядка 1 то вася будет вашим фолловером и такого добра можно много накрутить

аналогично и число ретвитов легко сделать

вот с живыми диалогами сложнее. писать вопрос и давать ответ, это простыми средствами не сделать
и если у аккаунта мало диалогов - почти наверняка бот.

Alexbenua97

full member

Activity: 420

Merit: 100

Да алгоритм думаю простой в данном случае. Если нет постов в аккаунте и нет фото на аватарке а много подписчиков и подписок, программа распознает такой профиль как бот

opticalpony

member

Activity: 84

Merit: 10

reverse engineering

Quote from: Jeex on January 12, 2018, 11:18:56 AM

Quote from: opticalpony on January 12, 2018, 09:56:33 AM

Автор скажи для чего тебе алгоритм по которому сканирование на наличие ботов происходит?

Ну хотя бы для того, чтобы вручную проверять каждого нового подписчика и всех, кто проверку не прошел - в блок.

Quote from: opticalpony on January 12, 2018, 09:56:33 AM

Собственно знаю формулу по которой вычисление в этом сервисе идет, а вот для чего она тебе это вопрос?

А я знаю, что ЧСВ повысить можно только написав что-то дельное, по существу. "Знающих", которые по факту не знают ничего - на этом форуме пруд-пруди.

Собственно говоря я помочь хотел поэтому и спросил, ну раз вы такой умный то удачи с поиском алгоритмов критериев по которому твиттераудит диагностирует ботов.

Jeex

member

Activity: 364

Merit: 58

Quote from: opticalpony on January 12, 2018, 09:56:33 AM

Автор скажи для чего тебе алгоритм по которому сканирование на наличие ботов происходит?

Ну хотя бы для того, чтобы вручную проверять каждого нового подписчика и всех, кто проверку не прошел - в блок.

Quote from: opticalpony on January 12, 2018, 09:56:33 AM

Собственно знаю формулу по которой вычисление в этом сервисе идет, а вот для чего она тебе это вопрос?

А я знаю, что ЧСВ повысить можно только написав что-то дельное, по существу. "Знающих", которые по факту не знают ничего - на этом форуме пруд-пруди.

opticalpony

member

Activity: 84

Merit: 10

reverse engineering

Автор скажи для чего тебе алгоритм по которому сканирование на наличие ботов происходит?
Собственно знаю формулу по которой вычисление в этом сервисе идет, а вот для чего она тебе это вопрос?

Jeex

member

Activity: 364

Merit: 58

Quote from: zhelezo on January 11, 2018, 06:59:53 AM

бот он и Африке бот. нет аватарки, нет твитов, подписчиков децл

Ваш алгоритм поиска ботов очень далек от действительности. Есть боты с сотнями тысяч подписчиков, клепающие по 5000 твитов в сутки на разных языках. В этом случае бот палится по нереальному, как для человека кол-ву постов в сутки. Аккаунты без автарки - это скорее всего начинающие пользователи ПК или лентяи, чем боты...

zhelezo

full member

Activity: 350

Merit: 103

бот он и Африке бот. нет аватарки, нет твитов, подписчиков децл - давай до свидания. хотя не понимаю, почему боты массово не подписываются друг на друга.

Aradeng

full member

Activity: 261

Merit: 107

Есть еще сервис fakers.statuspeople.com
Иногда требуют его результаты.
У него с твиттераудитом могут очень отличаться результаты.
Разные алгоритмы.

magnat_8

jr. member

Activity: 672

Merit: 5

Жать что не ответа на этот вопрос 😕

ferumflex

full member

Activity: 256

Merit: 102

Я думаю там факторов миллион. Как с ранжирование страницы в поиске у гугла. Но самое главное думаю, качество постов, качество аудитории на которой подписан аккаунт

quantum

member

Activity: 108

Merit: 250

Ну никто, кроме создателей сервиса не скажет. А им и незачем

Можете попробовать выяснить опытным путем

Jeex

member

Activity: 364

Merit: 58

Понятное дело, что влияют данные из аккаунта, но ключевой вопрос КАК? По каким признакам определяются "нормальные" твиты, какое соотношение подписчиков к подпискам считается плохим и т.д.? Просьба писать конкретные данные.

quantum

member

Activity: 108

Merit: 250

Quote

This score is based on number of tweets, date of the last tweet, and ratio of followers to friends. We use these scores to determine whether any given user is real or fake. Of course, this scoring method is not perfect but it is a good way to tell if someone with lots of followers is likely to have increased their follower count by inorganic, fraudulent, or dishonest means.

Хитрая формула: у ботов плохо с нормальными твитами, и соотношение подписок к подписчикам зашкаливает

Jeex

member

Activity: 364

Merit: 58

Есть много сервисов, как например Twitteraudit, которые распознают ботов среди подписчиков. Хотелось бы узнать, на основании чего Twitteraudit определяет, что этот аккаунт - бот, а другой - человек? Т.е. хотелось бы выяснить алгоритм распознавания ботов.

Topic: Twitteraudit - алгоритм распознавания ботов? (Read 297 times)