Социальная сеть Digg отказывается от использования MySQL
Популярная социальная сеть Digg переписывает собственное управляющее программное обеспечение для повышения производительности и масштабируемости сети. Об этом сообщила администрация сети.
В рамках данных усилий технический персонал Digg намерен отказаться от использования открытой СУБД MySQL, которая использовалась здесь с момента начала работы. Занять место MySQL должна будет открытая нереляционная СУБД Cassandra, также называемая NoSQL. В рамках проекта по миграции с MySQL на Cassandra разработчики Digg создадут специальные средства для переноса данных, которые позже будут доступны свободно, что позволит другим проектам сделать то же самое.
"Мы уже разработали программу Transcribe. Она использует преимущества программы Hadoop для переноса очень больших объемов данных с MySQL. Все созданные нами средства мы планируем разместить в открытом доступе для других разработчиков", - говорит Джон Киунн, вице-президент по разработкам Digg.
В основе СУБД NoSQL лежит довольно новый подход, отличающийся от подхода работы с данным в традиционных реляционных СУБД, таких как MySQL или Microsoft SQL Server. Cassandra не является единственной NoSQL-СУБД, есть и другие, например CouchDB или MongoDB. "Мы исследовали много NoSQL-решений и остановились именно на Cassandra, так как эта разработка поддерживает надежную модель хранения BigTable и возможность распределенного хранения данных в нескольких датацентрах", - говорит Куинн.
По его словам, впервые тестировать Cassandra Digg начал еще в сентябре 2009 года. После переноса на новую платформу Digg также надеется повысить общую производительность системы. "Мы движемся к децентрализованной системе, здесь каждый узел равнозначен другому и нет центрального сервера. Такая модель удивительно надежна и эластична. Мы будем наращивать масштабируемость системы параллельно с вводом в строй новых сервисов", - отметил он.
При этом, он отметил, что хоть основным механизмом хранения и станет Cassandra, использование MySQL в ограниченных масштабах будет продолжено. "В некоторых случаях MySQL может предоставить ту гибкость работы с данными, которой нет у Cassandra. MySQL очень хорош для небольших проектов", - резюмировал Куинн.