Если я правильно помню биржевую теорию, то цена закрытия за некий период это и есть аск цена. Те-еж свечки рисуются по четырем параметрам: это цена открытия и закрытия, внутри минимальная и максимальная цена, либо за аск цену считают среднее между минимальной и максимальной, но по моему это не совсем верно, поправьте меня пожалуйста. Посему чтобы взять и прогнать даже базовую стратегию, надо знать и цену покупки и цену продажи в в конкретный момент времени либо во временной интервал.
Только данные depth могут дать адекватную и верную информацию по цене покупки и продажи на момент времени, особенно это актуально во время сильного движения, другое дело, что исходя из некоторых законов рынка (а так же если учесть алгоритмы типичных манипуляторов) эти данные можно извлечь и из истории сделок, даже агригированных по некоторому интерваллу, но это нетривиальные формулы. Кое какую информацию дают классические индикаторы.
Вся проблема - в леквидности и волотильности рынка. Чем большими объемами приходится оперировать, тем большие допущения и ошибки будут вносить данные, восстановленные из простой истории сделок. Вам кажется что курс скачет вверх-вниз постепенно сужаясь (классический треугольник)? а на самом деле это из-за недостаточной скорости наполнения стакана рынок пожирает аски и биды по краям пустого стакана, поедая жалкие крохи, которые туда закладывают боты мелких спекулянтов, а когда просыпаются крупные трейдеры с ручными ордерами, стакан становится узким.
В данный момент, лично у меня за апрель около 1кк записей, весом около 800мб. Для базы это пока мало, дальше будем дробить по таблицам.
Смотря как хранить. Самое эффективное, через определенный интервал времени сохранять весь стакан и последовательно информацию о его изменении (интервал лучше выбирать исходя их хадач, например суточный или недельный), но с точки зрения универсальности (особенно для удобства публикации) - лучше хранить в виде файлов, которые отдает сама биржа, упакованных поинтервально в архиве (например ежемесячные архивы поминутных дампов depth).
Обрабатывать такие данные удобно теми же алгоритмами, по которым работают сами боты, что очень удобно для тестирования стратегий.
Десятки мегабайт в месяц на биржу - это смехотворные объемы, а архиватор 7z невероятно быстро работает на чтение.