Author

Topic: Twitteraudit - алгоритм распознавания ботов? (Read 297 times)

newbie
Activity: 39
Merit: 0
Нашел информацию по работе аналога Twitteraudit - Fakefollowers. Fakefollowers определяет ботов по нескольким критериям.

1. число фолловеров — соотношение 50:1 и более (т.е. профиль подписан на 50 аккаунтов, а у самого всего лишь 1 фолловер),
2. более 30% твитов содержать спам-слова (диеты, заработок, работа на дому и т.д.),
3. повтор одних и тех же твитов более трех раз,
4. 90% твитов аккаунта — ретвиты,
5. 90% твитов аккаунта — ссылки,
6. аккаунт никогда не публиковал твиты,
7. аккаунт создан более двух месяцев назад, но в аватаре профиля по-прежнему стоит картинка по умолчанию,
8. в аккаунте нет никакой информации о пользователе, но при этом он подписан на 100+ профилей.

Каждому из критериев, перечисленных выше, дается определенное количество баллов, и как только они достигают определенной отметки, аккаунт считается подозрительным.

Помимо подозрительных аккаунтов система ищет неактивных пользователей на основании двух критериев:

аккаунт опубликовал менее трех твитов,
последний твит был опубликован более 90 дней назад.
Остальных пользователей система относит к «хорошим».

Думаю подобные алгоритмы использует и Twitteraudit.
newbie
Activity: 182
Merit: 0
Есть много сервисов, как например Twitteraudit, которые распознают ботов среди подписчиков. Хотелось бы узнать, на основании чего Twitteraudit определяет, что этот аккаунт - бот, а другой - человек? Т.е. хотелось бы выяснить алгоритм распознавания ботов.
Боюсь что алгоритм распознования ботов сервисом, коммерческая тайна (площадка то коммерческая) и соответственно реальную инфу получить будет очень затруднительно...
Не буду удивлен если подобные сервисы используют для таких целей искуственный интелект и нейросети...
newbie
Activity: 39
Merit: 0
Тоже очень интересно знать алгоритм работы, или понимать какими методами нельзя раскручивать свой аккаунт Twitter, чтобы алгоритм его не записал в боты.
newbie
Activity: 84
Merit: 0
Большинство ботов ведут себе одинаково, кроме частоты постинга айпишников есть поведенческие факторы которые под которые гораздо сложнее подстраивать ботов
newbie
Activity: 65
Merit: 0
Редкое и низкое количество твитов, отсутствие аватарки, сумма подписок и подписчиков.
Может быть дата регистрации еще как-то влияет.

с точки зрения программирования ботов это не так:
1. число твитов  легко сделать любым
2. аватарка опять таки это одна команда. случайно дергается картинка и гугл поиска, обрабатывается и делается аватаркой
3. с числом фолловеров сложнее, но опять таки - проходишь роботом по тем кто взаимный фоловинг и смотришь дробь "сколько людей читают Васю/ Сколько людей читает вася"
. если дробь порядка 1 то вася будет вашим фолловером и такого добра можно много накрутить

аналогично и число ретвитов легко сделать

вот с живыми диалогами сложнее. писать вопрос и давать ответ, это простыми средствами не сделать
и если у аккаунта мало диалогов - почти наверняка бот.
full member
Activity: 420
Merit: 100
Да алгоритм думаю простой в данном случае. Если нет постов в аккаунте и нет фото на аватарке а много подписчиков и подписок, программа распознает такой профиль как бот
member
Activity: 84
Merit: 10
reverse engineering
Автор скажи для чего тебе алгоритм по которому сканирование на наличие ботов происходит?
Ну хотя бы для того, чтобы вручную проверять каждого нового подписчика и всех, кто проверку не прошел - в блок.

Собственно знаю формулу по которой вычисление в этом сервисе идет, а вот для чего она тебе это вопрос?
А я знаю, что ЧСВ повысить можно только написав что-то дельное, по существу. "Знающих", которые по факту не знают ничего - на этом форуме пруд-пруди.
Собственно говоря я помочь хотел поэтому и спросил, ну раз вы такой умный то удачи с поиском алгоритмов критериев по которому твиттераудит диагностирует ботов.
member
Activity: 364
Merit: 58
Автор скажи для чего тебе алгоритм по которому сканирование на наличие ботов происходит?
Ну хотя бы для того, чтобы вручную проверять каждого нового подписчика и всех, кто проверку не прошел - в блок.

Собственно знаю формулу по которой вычисление в этом сервисе идет, а вот для чего она тебе это вопрос?
А я знаю, что ЧСВ повысить можно только написав что-то дельное, по существу. "Знающих", которые по факту не знают ничего - на этом форуме пруд-пруди.
member
Activity: 84
Merit: 10
reverse engineering
Автор скажи для чего тебе алгоритм по которому сканирование на наличие ботов происходит?
Собственно знаю формулу по которой вычисление в этом сервисе идет, а вот для чего она тебе это вопрос?
member
Activity: 364
Merit: 58
бот он и Африке бот. нет аватарки, нет твитов, подписчиков децл
Ваш алгоритм поиска ботов очень далек от действительности. Есть боты с сотнями тысяч подписчиков, клепающие по 5000 твитов в сутки на разных языках. В этом случае бот палится по нереальному, как для человека кол-ву постов в сутки. Аккаунты без автарки - это скорее всего начинающие пользователи ПК или лентяи, чем боты...
full member
Activity: 350
Merit: 103
бот он и Африке бот. нет аватарки, нет твитов, подписчиков децл - давай до свидания. хотя не понимаю, почему боты массово не подписываются друг на друга.
full member
Activity: 261
Merit: 107
Есть еще сервис fakers.statuspeople.com
Иногда требуют его результаты.
У него с твиттераудитом могут очень отличаться результаты.
Разные алгоритмы.
jr. member
Activity: 672
Merit: 5
Жать что не ответа на этот вопрос 😕
full member
Activity: 256
Merit: 102
Я думаю там факторов миллион. Как с ранжирование страницы в поиске у гугла. Но самое главное думаю, качество постов, качество аудитории на которой подписан аккаунт
member
Activity: 108
Merit: 250
Ну никто, кроме создателей сервиса не скажет. А им и незачем Smiley
Можете попробовать выяснить опытным путем
member
Activity: 364
Merit: 58
Понятное дело, что влияют данные из аккаунта, но ключевой вопрос КАК? По каким признакам определяются "нормальные" твиты, какое соотношение подписчиков к подпискам считается плохим и т.д.? Просьба писать конкретные данные.
member
Activity: 108
Merit: 250
Quote
This score is based on number of tweets, date of the last tweet, and ratio of followers to friends. We use these scores to determine whether any given user is real or fake. Of course, this scoring method is not perfect but it is a good way to tell if someone with lots of followers is likely to have increased their follower count by inorganic, fraudulent, or dishonest means.

Хитрая формула: у ботов плохо с нормальными твитами, и соотношение подписок к подписчикам зашкаливает
member
Activity: 364
Merit: 58
Есть много сервисов, как например Twitteraudit, которые распознают ботов среди подписчиков. Хотелось бы узнать, на основании чего Twitteraudit определяет, что этот аккаунт - бот, а другой - человек? Т.е. хотелось бы выяснить алгоритм распознавания ботов.
Jump to: