Университет Киото, одно из лучших научно-исследовательских учреждений в Японии, имеет в своем распоряжении суперкомпьютерную систему Hewlett Packard Cray, совмещенную с системой хранения данных DataDirect ExaScaler, которые используются различными исследовательскими группами в своих целях. И не так давно в ходе вроде бы обычной операции резервного копирования произошел сбой, в результате которого было безвозвратно утеряно порядка 77 терабайт данных, что является одной из самых масштабных потерь данных за всю историю человечества.
По имеющейся информации сбой произошел в период между 14 и 16 декабря 2021 годы. В результате этого были стерты 34 миллиона файлов, принадлежащих 14 исследовательским группам. Первоначальный объем потерянных данных составлял почти 100 терабайт, но некоторую часть данных все же удалось восстановить различными путями.
Пока еще неизвестны точные причины того, что вызвало такой масштабный сбой и какие типы пользовательских файлов были этим затронуты. Тем не менее, по крайней мере четыре исследовательских группы больше уже не смогут возобновить свою работу из-за полной утраты своих ключевых данных, по всей видимости, им придется начинать все заново с нуля.
И в заключение следует отметить, что вычисления на суперкомпьютерах отличаются от вычислений на обычных компьютерах возможностью масштабного распараллеливания задач, над которыми могут одновременно работать сотни, тысячи и даже миллионы вычислительных ядер. Огромная вычислительная мощность делает все это чрезвычайно ценным инструментом в самых различных областях, включая моделирование атмосферных процессов и климатических изменений, моделирование физических, химических процессов, разработку новых материалов и лекарственных препаратов и т.п.
К сожалению, как показал последний печальный опыт, все это может стать бессмысленным, если суперкомпьютерная система не работает правильно и в ней могут возникнуть такие масштабные сбои.