ADD 2010: Отчет Титаренко Константина/Сравнительный анализ хранилищ данных
Выступали вдвоем, друг друга перебивали, спорили, порой казалось, что сейчас подерутся. Слайды были без картинок, без уточнения определений, и вообще слабо понятны сходу. (Кстати, подобными слайдами грешили и другие докладчики на этой конференции. Порой возникало ощущение, что люди просто не пожелали хорошо подготовиться.)
Олег и Кирилл рассказывали об организации данных для соц-сетей на примере организации взаимодействия между участниками сети, рассматривали матрицу смежности и пытались подсчитать стоимость проекта, который эту задачу решит. Получалось, что при любом подходе нужно искать компромисс по трем осям:
- memory, CPU
- latency
- сложность кода
Возникают производные оси:
- бюджет проекта
- сроки
- лимит разработчиков
- аппаратура
- инструменты
Выводы:
- универсальных решений нет
- цель менеджера проекта — найти компромисс, локальный оптимум
- иногда задача неразрешима в заданных условиях
- обычно в итоге приходят к кластеру
Рассматривали партицирование данных:
- горизонтальное-вертикальное
- ручное
- автоматическое
Далее был рассказ про CAP-теорему, на середине которого я сбежал на другой доклад.