Pages:
Author

Topic: Автоматизация малой «фермы». Часть 1 (Read 9283 times)

hero member
Activity: 616
Merit: 502
Остановит, но после остывания продолжит майнить. Было два вынужденных эксперимента на 5770. Осенью писал о них. Коротко, остановился вентилятор, и карта какое то время работала в таком режиме, скорость 200мх, пока температура ниже 90С, как только нагревалась выше 90С, скорость падала до 100мх и так было несколько часов. Через месяц эксперимент повторился на другой карте. Не успел вовремя заметить, и в результате помер блок питания… Карта осталась живой, но больше не работает на частоте 960MHz.
Была такая фигня тоже, одна 5850ая замедлилась - приехал посмотреть - вентилятор загудел, обороты упали, но блок питания не сгорел, почистил - полет нормальный (температуру не посмотрел, но паленым пахло, часа два добирался..)
member
Activity: 102
Merit: 10
Остановит, но после остывания продолжит майнить. Было два вынужденных эксперимента на 5770. Осенью писал о них. Коротко, остановился вентилятор, и карта какое то время работала в таком режиме, скорость 200мх, пока температура ниже 90С, как только нагревалась выше 90С, скорость падала до 100мх и так было несколько часов. Через месяц эксперимент повторился на другой карте. Не успел вовремя заметить, и в результате помер блок питания… Карта осталась живой, но больше не работает на частоте 960MHz.
AV
hero member
Activity: 910
Merit: 1000
Термопредохранитель. В случает перегрева видеокарты, остановки вентилятора, предохранитель сгорит, разомкнёт цепь и комп выключится.
В случае перегрева видеокарта сама остановит свою работу.
member
Activity: 102
Merit: 10
Термопредохранитель. Варианты здесь и здесь
Обычно компьютерный блок питания включается замыканием черного и зелёного провода. Подумал, если в разрыв этой цепи включить предохранитель градусов на 80… 90. В случает перегрева видеокарты, остановки вентилятора, предохранитель сгорит, разомкнёт цепь и комп выключится. Часто применяются в утюгах, кофеварках.
Купил себе немного. Пока ещё не ставил, так как планировал на водоблок   поставить. Родной радиатор пока не хочу портить, вдруг зимой придётся карты продавать. Да и блоки питания пока ещё на гарантии.
Один из выводов связан с корпусом. Нужно изолировать. В утюгах он находится в тряпочной термостойкой трубке. Для тех, кто решиться на эксперимент, вероятно надо выбирать на меньшую температуру, так как проще их крепить на край радиатора и самое главное, их паять нельзя. Только обжим.

В утюге они закреплены так
member
Activity: 65
Merit: 10
Я для мониторинга и управления под виндой использую nncron и clocktweak.
Есть еще вариант использования со шлюхами Smiley
hero member
Activity: 535
Merit: 500
так cgminer сам отрубает видюхи при перегреве. У меня на одной кулер почти сдох. минуту майнит нормально, перегрев, cgminer убивает 1 тред из двух, температура спадает, включает второй тред обратно. Ну и плюс он еще частоты сбрасывает в указанном пределе.
Для надежности лучше всю систему отключать. Если кулер помрет, то cgminer уже не поможет. Тем более у меня он не может их отключить почему то.
sr. member
Activity: 308
Merit: 250
так cgminer сам отрубает видюхи при перегреве. У меня на одной кулер почти сдох. минуту майнит нормально, перегрев, cgminer убивает 1 тред из двух, температура спадает, включает второй тред обратно. Ну и плюс он еще частоты сбрасывает в указанном пределе.
hero member
Activity: 535
Merit: 500
Ну а как-то можно сделать, чтобы прога считывала температуру, с gpu-z например? Я бы даже заплатил за нее.
 Следить за хэшрейтом не слишком надежно имхо, т.к. сам пул может зависнуть, а видюха наоборот -может хэшировать нормально, но греться будет не по-детски, если случится что с охлаждением.
Вряд ли, если пул зависнет, видюха будет что-то хешировать, она же не будет получать никаких заданий?
Я про две разные ситуации говорю. 1 - эта прога не поможет от перегрева. Видюха будет хэшировать, пока не сгорит или пока не сработает встроенная система защиты от перегрева (это если температура до 100С поднимется, что уже может повредить гпу безвозвратно).
 2. Пул виснет, и прога вырубает комп. Потеря времени опять же.

1. Изначально вопрос обсуждался о том, что лучше перегружать комп не по расписанию, на случай зависания карт, а по факту зависания как такового. Ребут каждые 2 часа - сомнительное решение защиты от перегрева.
Мне не нужен ребут, а только полное отключение компа, до выяснения причин. Есть еще вариант - читать показания температуры через апи cgminer'а. Для примера, есть пхп скрипт в этой теме, который показывает полную статистику для видюх. Сам его использую.
 https://bitcointalksearch.org/topic/cgminer-web-monitor-beta-v08-58834


 Реально же сделать?

2. В скрипт допиши проверку наличия ответа от пула на запрос API. Нет ответа вообще - ничего не делаем, майнер перескочит на другой пул. Есть ответ, но хешрейт упал - перегружаемся.
Он похоже не cgminer-ом майнит, соответственно и мучается проблемами с перегревом и переключением пулов Smiley
Да нет у меня проблем с перегревом, просто нужна нормальная подстраховка на непредвиденный случай.
sr. member
Activity: 308
Merit: 250
2. В скрипт допиши проверку наличия ответа от пула на запрос API. Нет ответа вообще - ничего не делаем, майнер перескочит на другой пул. Есть ответ, но хешрейт упал - перегружаемся.
Он похоже не cgminer-ом майнит, соответственно и мучается проблемами с перегревом и переключением пулов Smiley

А в cgminer другие проблемы будут - у меня вот например изредка одна из карт в cgminer переходит в статус DEAD, перезагрузка помогает, но проверка на пуле по API ничего не даст т.к. по воркерам карты не разнесены.. Если только по уменьшению скорости смотреть, но это тоже может ложные срабатывания давать..
И потом, если этот же cgminer переключился на другой пул - то будет перегружать постоянно т.к. API пула будет возвращать нули Smiley

Можно мониторить логи cgminer, и когда он в них напишет что-то про DEAD или SICK, ребутать комп. У меня так почти на всех линуксовых машинах.
member
Activity: 102
Merit: 10
Новая игрушка. Дополнение от 09042012.
EnerGenie EG-PMS-LAN Сетевой фильтр с LAN
Внешнее устройство выглядит крупнее обычного сетевого фильтра. Похоже внутри находится блок питания для сетевого контроллера и платы управления розетками. Шнур питания имеет длину 1.8 м.
На лицевой стороне устройства находится тумблер питания, который отключает все розетки. Всего имеется 6 розеток, 4-мя розетками можно управлять. Возле каждой управляемой розетки есть оранжевый индикатор и номер розетки.
legendary
Activity: 3122
Merit: 1032
#1 VIP Crypto Casino
А в cgminer другие проблемы будут - у меня вот например изредка одна из карт в cgminer переходит в статус DEAD, перезагрузка помогает, но проверка на пуле по API ничего не даст т.к. по воркерам карты не разнесены.. Если только по уменьшению скорости смотреть, но это тоже может ложные срабатывания давать..
По уменьшению скорости можно подобрать. У меня в скрипте 10 указано - можно заменить на скорость без одной карты, как вариант.
И потом, если этот же cgminer переключился на другой пул - то будет перегружать постоянно т.к. API пула будет возвращать нули Smiley
Мне сии проблемы не ведомы, я на одном пуле сижу )))) Ну а серьезно, дописать код с учетом нескольких возможных пулов не проблема. Как только на одном пуле карты откликнулись хешрейтом в пределах нормы - break, иначе - переходим к следующему. Все молчат - reboot.
full member
Activity: 213
Merit: 100
2. В скрипт допиши проверку наличия ответа от пула на запрос API. Нет ответа вообще - ничего не делаем, майнер перескочит на другой пул. Есть ответ, но хешрейт упал - перегружаемся.
Он похоже не cgminer-ом майнит, соответственно и мучается проблемами с перегревом и переключением пулов Smiley

А в cgminer другие проблемы будут - у меня вот например изредка одна из карт в cgminer переходит в статус DEAD, перезагрузка помогает, но проверка на пуле по API ничего не даст т.к. по воркерам карты не разнесены.. Если только по уменьшению скорости смотреть, но это тоже может ложные срабатывания давать..
И потом, если этот же cgminer переключился на другой пул - то будет перегружать постоянно т.к. API пула будет возвращать нули Smiley
legendary
Activity: 3108
Merit: 1359
Если файловая система в ридонли смонтирована, то перезагружать можно сколько влезет.

А переходные процессы в БП и всём остальном куда девать? Электроприборы чаще всего горят в момент включения.
Для ПКшного железа это несущественно. К тому же, переходные процессы и конденсаторы большой емкости - это слабосовместимые вещи.

Другое дело, что сама мысль непонятна. Зачем ребутить, если все работает?
legendary
Activity: 3122
Merit: 1032
#1 VIP Crypto Casino
Ну а как-то можно сделать, чтобы прога считывала температуру, с gpu-z например? Я бы даже заплатил за нее.
 Следить за хэшрейтом не слишком надежно имхо, т.к. сам пул может зависнуть, а видюха наоборот -может хэшировать нормально, но греться будет не по-детски, если случится что с охлаждением.
Вряд ли, если пул зависнет, видюха будет что-то хешировать, она же не будет получать никаких заданий?
Я про две разные ситуации говорю. 1 - эта прога не поможет от перегрева. Видюха будет хэшировать, пока не сгорит или пока не сработает встроенная система защиты от перегрева (это если температура до 100С поднимется, что уже может повредить гпу безвозвратно).
 2. Пул виснет, и прога вырубает комп. Потеря времени опять же.

1. Изначально вопрос обсуждался о том, что лучше перегружать комп не по расписанию, на случай зависания карт, а по факту зависания как такового. Ребут каждые 2 часа - сомнительное решение защиты от перегрева.
2. В скрипт допиши проверку наличия ответа от пула на запрос API. Нет ответа вообще - ничего не делаем, майнер перескочит на другой пул. Есть ответ, но хешрейт упал - перегружаемся.
hero member
Activity: 535
Merit: 500
Ну а как-то можно сделать, чтобы прога считывала температуру, с gpu-z например? Я бы даже заплатил за нее.
 Следить за хэшрейтом не слишком надежно имхо, т.к. сам пул может зависнуть, а видюха наоборот -может хэшировать нормально, но греться будет не по-детски, если случится что с охлаждением.
Вряд ли, если пул зависнет, видюха будет что-то хешировать, она же не будет получать никаких заданий?
Я про две разные ситуации говорю. 1 - эта прога не поможет от перегрева. Видюха будет хэшировать, пока не сгорит или пока не сработает встроенная система защиты от перегрева (это если температура до 100С поднимется, что уже может повредить гпу безвозвратно).
 2. Пул виснет, и прога вырубает комп. Потеря времени опять же.
legendary
Activity: 3122
Merit: 1032
#1 VIP Crypto Casino
Ну а как-то можно сделать, чтобы прога считывала температуру, с gpu-z например? Я бы даже заплатил за нее.
 Следить за хэшрейтом не слишком надежно имхо, т.к. сам пул может зависнуть, а видюха наоборот -может хэшировать нормально, но греться будет не по-детски, если случится что с охлаждением.
Вряд ли, если пул зависнет, видюха будет что-то хешировать, она же не будет получать никаких заданий? Под windows я не видел никаких открытых способов получения показаний датчиков температуры GPU, ну если не считать nvidia, да и честно говоря, не заморачивался этим особо.
hero member
Activity: 535
Merit: 500
А можно ее переделать, чтобы она не хэшрейт мониторила, а температуру видях. И если где то она повышается больше дозволенного (например до 74 С), то прога немедленно выключает комп.
Это называется не "передалать", а написать другую  Grin
Этот скрипт проверяет хешрейт через API сайта пула, а они вряд ли мониторят температуру ваших видеокарт.
Ну а как-то можно сделать, чтобы прога считывала температуру, с gpu-z например? Я бы даже заплатил за нее.
 Следить за хэшрейтом не слишком надежно имхо, т.к. сам пул может зависнуть, а видюха наоборот -может хэшировать нормально, но греться будет не по-детски, если случится что с охлаждением.
legendary
Activity: 3122
Merit: 1032
#1 VIP Crypto Casino
А можно ее переделать, чтобы она не хэшрейт мониторила, а температуру видях. И если где то она повышается больше дозволенного (например до 74 С), то прога немедленно выключает комп.
Это называется не "передалать", а написать другую  Grin
Этот скрипт проверяет хешрейт через API сайта пула, а они вряд ли мониторят температуру ваших видеокарт.
legendary
Activity: 3122
Merit: 1032
#1 VIP Crypto Casino
Если надо, выложу куда-нидь.
Что за вопросы, конечно надо, выкладывай.

http://pool.mkalinin.ru/download/BTCAPI.exe

Делал для себя, поэтому такие условия: компы, которые отслеживаются прогой, должны называться так же как соответствующие им майнеры. И на тех компах должна быть такая же учетная запись как на том, с которого мониторится, чтобы он командой shutdown смог бы их грузануть.
hero member
Activity: 535
Merit: 500
настроил что бы один комп автоматом перегружался раз в 2 часа,
потому что одна видюха периодически отваливается при непрерывной работе
в чём дело не знаю ) пусть так работает )
Можно же настроить так, чтобы перегружался по факту отваливания, а не по расписанию. Если на линуксе - в cron прописать скрипт типа такого:
Code:
if (isset($_SERVER['REMOTE_ADDR']) && $_SERVER['REMOTE_ADDR'] != "127.0.0.1") {
echo "This script can only be run locally.";
exit;
}

$opts = array(
  
'http'=> array(
    
'method'=>   "GET",
    
'user_agent'=>    "MozillaXYZ/1.0"));
$context stream_context_create($opts);
$json file_get_contents('http://pool.mkalinin.ru/api.php?api_key='************', false, $context); // replace by your own api key
$json = json_decode($json);

$hrate = $json->{'
workers'}->{'***********'}->{'hashrate'}; // replace by worker's name
echo $hrate;
if (
$hrate 10){
 
exec("/usr/bin/sudo /sbin/shutdown -r now");
}
?>


Если на Windows - тоже написал программку, которая висит в сетке и мониторит состояния железяк по хешрейту, если где-то упало - дает команду на ребут. В 99% (если желехяка не словила экран смерти) помогает. Если надо, выложу куда-нидь.
А можно ее переделать, чтобы она не хэшрейт мониторила, а температуру видях. И если где то она повышается больше дозволенного (например до 74 С), то прога немедленно выключает комп.
Pages:
Jump to: