Весна понемногу наступает и с ней приходит солнце и тепло. Для майнеров (особенно GPU-майнеров) это тяжелый период. Видеокарты начинают перегреваться, фермы виснуть, SICK, DEAD и прочее...Если с последними двумя проблемами поможет бороться CGWatcher, то от проблемы зависания программными средствами не спастись. При этом процесс перехода на "летние" частоты и напряжения довольно долгий и в итоге за последние 2 недели я потерял в сумме 40 часов времени двух моих ферм (4500 кх/с), а это не менее $10 при текущей сложности и курсе на лайтах (а погода еще не установилась). Поскольку майнинг изначально задумывался как доход "поставил и забыл" ибо есть основная работа, то эти проблемы противоречили концепции. А сколько машинного времени было потеряно при настройке ферм - об этом я даже не говорю.
Очевидно, что проблема зависания ОС не может быть решена чисто программным способом и требует подключения некой дополнительной железки, на рынке нашлось несколько решений:
1) GSM розетка. Первое, что пришло на ум, но для решения моей проблемы подходит с натяжкой. Перезапускать систему придется вручную, а не в тот момент когда она повисла. Устройство не отличает срабатывание защиты БП от зависания системы. У меня был случай когда Чифтек на 1200 Вт отключился по защите, а его повторное включение в сеть закончилось феерверком с огоньком и выбиванием автомата. Симки, балансы, SMS, качество приема и прочая ерунда тоже не плюс к применению. Сравнительная дороговизна ибо приходится подключать одно устройство к одной ферме, в противном случае выключаться будут и другие.
2) Сторожевые таймеры для платежных терминалов и прочие не профильные вещи. Из плюсов естественно то, что перезапустят сами без вашего участия. Одно устройство - одна ферма, при цене за устройство 800р + это недешево.
3) Различные устройства управления нагрузками по USB (например
http://www.chipdip.ru/product/mp710/). Как и в случае с GSM розеткой придется
перезапускать самому и при этом использовать дополнительный "сторожевой" ПК, также в устройстве нет гальванической развязки (описано здесь
https://forum.btcsec.com/index.php?/blog/126/entry-219-ferma-35mhashs-worklog-iipast/?st=20#commentsStart), поэтому ее нужно делать(колхоз).
Заказал себе пару сторожевых таймеров из пункта 2, но оказалось, что помимо всего прочего у меня была проблема которую не смогло решить даже это устройство. Одна из ферм (сокет 1155, 3х7970) зависала так, что нажатие на кнопку RESET ни к чему не приводило - помогало только длительное нажатие на кнопку POWER до выключения, а затем повторное нажатие для включения.
Я хочу, чтобы фермы перезагружались автоматически без моего участия в любых нештатных ситуациях, поэтому пришлось делать устройство под свои запросы самостоятельно….
Назвал его USBWatchDOGE.
Представляет собой небольшой(размером с флешку) USB стик, а также ПО для самой фермы. Принцип действия прост: программа, запущенная на ферме, периодически отправляет метку в USB порт, а USBWatchDOGE ее ждет. В случае если метки нет определенное время(которое настраивается в ПО фермы) ферма считается зависшей и перезапускается путем замыкания кнопки RESET (канал selfreset). Если каналов несколько, то канал selfreset(канал автоперезагрузки - выбирается в программе если каналов несколько),
остальные(если есть) управляются вручную из ПО. 4 канала максимум выбрал исходя из вменяемого количества проводов выходящих из одной маленькой платы (смотрите
https://forum.btcsec.com/index.php?/blog/126/entry-219-ferma-35mhashs-worklog-ii-past/?st=20#commentsStart). Фермы у меня 4, поэтому мне хватило 4 устройства. Можно
было бы обойтись и одним, но опять же это противоречит концепции "поставил и забыл", потому, как одна ферма будет перезапускаться сама, а за остальными придется следить самому.
Время, спустя которое ферма считается зависшей, настраивается в ПО.
Также реализован пресловутый режим ВЫКЛ/ВКЛ. Корректная отработка ситуации когда кнопка перезагрузки не позволяет перезапустить ферму(требуется дополнительный канал на кнопку включения). Сделал гальваническую развязку, чтоб не спалить фермы. Сделал, чтоб USBWatchDOGE можно было подключить не только к нативному USB разъему, но также и к внутренней гребенке к материнской плате фермы. Удобно, потому как получается меньшая длина проводов от устройства до клеммам кнопок на матплате.
Светодиоды моргают сигнализируя о состоянии фермы. Программа для ПК и самого USBWatchDOGE дубовая и сама не повиснет. Если ОС не стартанула после перезагрузки, USBWatchDOGE попробует перезапустить его через 5 минут.
В настоящее время переговариваюсь с автором программы CGWather, чтобы он добавил в нее поддержку нашего устройства.
Сами USBWatchDOGE в обоих исполнениях выглядят так:
http://ib3.keep4u.ru/b/2014/04/10/2b/2bce6897553fcc33914587e2f8ed8ea6.jpgПодключается одним концом в USB, вторым параллельно(вместо) кнопки RESET. Режим ВЫКЛ/ВКЛ реализуется использованием двух каналов устройства.
http://ib3.keep4u.ru/b/2014/04/10/cb/cbea8f983058e09ece4e064490796394.jpgЕсли у вас такая же проблема как у меня и вы хотите ее эффективно и быстро решить, то я могу предложить вам свое устройство. Первые 10 откликнувшиеся на условии бетатестирования получат одноканальное устройство бесплатно.
1 канальное устройство по цене 500 р
2 канальное устройство по цене 600 р
3 канальное устройство по цене 650 р
4 канальное устройство по цене 700 р
Можно криптовалютой.
Добавляю софт для USBWatchDOGE:
1) Драйвер(сторонний и никаких закладок в нем быть не может)
Для Windows:
http://www.silabs.com/Support%20Documents/Software/CP210x_VCP_Windows.zipДля Linux: не нужен
2) Программа для ПК:
Exe: https[Suspicious link removed]
Исходники:
https://www.dropbox.com/s/sp0lb7kkfmin9h5/110414-wdt-pc.zipПока выкладываю в таком виде, в ближайшее время оформим репозиторий, например, на github.
Инструкция для Linux готовится - будет добавлена в ближайшее время.
3) Видеоинструкция по установке и настройке делается - будет готова в ближайшее время.
Бетатестовые платы розданы