Author

Topic: Сирена на фатальный рост температуры или (Read 1187 times)

ri
full member
Activity: 140
Merit: 118
Любопытства ради затестил - запустил cgminer с параметром --temp-cutoff 65

В результате по факту достижения 65 градусов в логе увидел:

Code:
[2014-02-19 12:01:21] Hit thermal cutoff limit on GPU 0, disabling!

В таблице устройств никак не отмечает этот факт, кроме как нулевым хешрейтом ну и соответственно низкой температурой чипа:

Code:
GPU 0:  40.0C 1076RPM |  0.000/89.97Kh/s | A:256 R:0 HW:0 WU: 90.7/m I:16
legendary
Activity: 1001
Merit: 1005
Если же температура продолжает расти и достигает значения --temp-cutoff (95 по умолчанию), то майнинг на этой карте прекращается до тех пор, пока не будет запущен вручную (ну или если используется api - то через него).
как при этом помечается карта dead/sick/off ?
ri
full member
Activity: 140
Merit: 118
Да, полезное исследование, спасибо! Smiley
Вопросик - в тексте не раз упоминается 75 град - откуда cgminer занает об этой частоте, как к ней привязывается?
Ведь в строке запуска такого значения вроде не видно.

Это значение по умолчанию. Его можно переназначить опцией --temp-target. Например, если запускать cgminer так:

Code:
cgminer --scrypt -I 13 --gpu-engine 300-1200 --gpu-fan 0-100 --auto-fan --auto-gpu --temp-target 50  --temp-hysteresis 5 --url stratum-tcp://pool.net:666 --user worker.1 --pass password1

То он будет управлять скоростью вентилятора и частотой чипа так, чтобы температура чипа находилась в пределах 45-55 градусов (т.е. отклонение от 50 градусов не более, чем на 5).
jr. member
Activity: 58
Merit: 10
Да, полезное исследование, спасибо! Smiley
Вопросик - в тексте не раз упоминается 75 град - откуда cgminer занает об этой частоте, как к ней привязывается?
Ведь в строке запуска такого значения вроде не видно.
ri
full member
Activity: 140
Merit: 118
ri:

- а можно о действиях этих опций поподробнее?  Kiss

Ну, у меня, например, на 1 карту 7950 cgminer запускается с такими опциями (остальные опускаю, т.к. они не имеют отношения к теме):

Code:
--gpu-engine 300-1200 --gpu-memclock 1575 --gpu-fan 0-100 --auto-fan --auto-gpu

Сразу после запуска (пока карта холодная) частота ядра устанавливается в 1200 MHz. cgminer отслеживает температуру с тем, чтобы она находилась в пределах 75+-3 градуса (т.е. значение опции --temp-target плюс-минут значение опции --temp-hysteresis - поскольку у меня они не заданы, то используются дефолтовые значения 75 и 3 соответственно). Таким образом, при приближении к 78 градусам (75+3) вентиляторы карты раскручиваются до максимума, если этого недостаточно (у меня нет дополнительных средств охлаждения, так что как правило, это и происходит), то cgminer начинает плавно (с шагом 5-10MHz) снижать частоту ядра, чтобы не выходить за означенные пределы. Например, в текущий момент у меня температура ядра 77 при частоте 1050. Если каким-то образом ухудшить теплоотвод (например, поставить на место боковую крышку системника), то частота еще снизится. Если наоборот, улучшить теплоотвод (опять снять крышку), то по достижении 72 градусов (75-3) частота начинает повышаться - пока не достигнет установленного максимума (1200) или порога в 78 градусов.

Что касается опций --temp-overheat и --temp-cutoff - на своем опыте пояснить не могу, т.к. пока не было ситуаций, чтобы они сработали, но по идее оно должно работать так: при достижении температуры --temp-overheat (по умолчанию 85) частота ядра сразу сбрасывается до минимального значения. Если после этого температура снизилась, то cgminer опять начинает плавно ее повышать - до значения, при котором температура ядра будет в диапазоне, заданном --temp-target и --temp-hysteresis. Если же температура продолжает расти и достигает значения --temp-cutoff (95 по умолчанию), то майнинг на этой карте прекращается до тех пор, пока не будет запущен вручную (ну или если используется api - то через него).

Что касается конкретных значений - тут ничего не могу порекомендовать, по идее это зависит от чипа видеокарты, сам искал эту инфу на сайте amd для 7950, но, увы, не нашел. Посему пользую значения по умолчанию.
jr. member
Activity: 58
Merit: 10
ri:

- а можно о действиях этих опций поподробнее?  Kiss
full member
Activity: 176
Merit: 104
Bounty hunter, crypto investor and enthusiast
Дело осталось за малым: написать соотв. утилитку для API Cgminer.
Скидываешь состояние cgminer-а в лог и парсишь.

ri
full member
Activity: 140
Merit: 118
Действительно, если откажет внешняя система охлаждения (например, большой бытовой вентилятор, охлаждающий ферму), то вся ферма, начиная с видеокарт, накроется медным тазом, и никто вовремя этого не заметит.
Или, если откажет один из вентиляторов видекарты, то такой же финал ждет эту видеокарту.

Вообще-то ничего подобного не произойдет, по крайней мере, при правильных (или даже дефолтовых) опциях cgminer.

Code:
$ cgminer --help |grep temp
--auto-fan          Automatically adjust all GPU fan speeds to maintain a target temperature
--auto-gpu          Automatically adjust all GPU engine clock speeds to maintain a target temperature
--gpu-reorder       Attempt to reorder GPU devices according to PCI Bus ID
--no-restart        Do not attempt to restart GPUs that hang
--temp-cutoff Temperature where a device will be automatically disabled, one value or comma separated list (default: 95)
--temp-hysteresis Set how much the temperature can fluctuate outside limits when automanaging speeds (default: 3)
--temp-overheat Overheat temperature when automatically managing fan and GPU speeds, one value or comma separated list (default: 85)
--temp-target Target temperature when automatically managing fan and GPU speeds, one value or comma separated list (default: 75)

И зачем тут сирена?
jr. member
Activity: 58
Merit: 10
Сирена на фатальный рост температуры или вентиляторов

У Cgminer есть свой API. Кто-нить пробовал практически или хотя бы теоретически рассмотреть возможность подачи сирены при случаях:

1) фатальный рост температуры GPU
2) отказ одного из вентиляторов видеокарт

Действительно, если откажет внешняя система охлаждения (например, большой бытовой вентилятор, охлаждающий ферму), то вся ферма, начиная с видеокарт, накроется медным тазом, и никто вовремя этого не заметит.
Или, если откажет один из вентиляторов видекарты, то такой же финал ждет эту видеокарту.

Вот и подумалось: если вместо системного динамика приспособить, например, паровозный ревун  Grin , то эти фатальные события могут быть сразу предотвращены своевременным обесточиванием фермы, углекислотным огнетушителем и т.д.

Дело осталось за малым: написать соотв. утилитку для API Cgminer.
Jump to: