ADD 2010: Отчет Титаренко Константина/Сравнительный анализ хранилищ данных

Материал из CustisWiki
Перейти к: навигация, поиск
Сравнительный анализ хранилищ данных (Олег Царев и Кирилл Коринский на ADD-2010)

Выступали вдвоем, друг друга перебивали, спорили, порой казалось, что сейчас подерутся. Слайды были без картинок, без уточнения определений, и вообще слабо понятны сходу. (Кстати, подобными слайдами грешили и другие докладчики на этой конференции. Порой возникало ощущение, что люди просто не пожелали хорошо подготовиться.)

Стас Фомин 20:15, 5 октября 2010 (UTC): Мы неоднократно рассылкали и публиковали памятки-обращения к докладчикам. См. например, [1]. Просто мало из потенциальных докладчиков в курсе, «что такое хорошо». В основном только профессиональные евангелисты.

Олег и Кирилл рассказывали об организации данных для соц-сетей на примере организации взаимодействия между участниками сети, рассматривали матрицу смежности и пытались подсчитать стоимость проекта, который эту задачу решит. Получалось, что при любом подходе нужно искать компромисс по трем осям:

  • memory, CPU
  • latency
  • сложность кода

Возникают производные оси:

  • бюджет проекта
  • сроки
  • лимит разработчиков
  • аппаратура
  • инструменты

Выводы:

  • универсальных решений нет
  • цель менеджера проекта — найти компромисс, локальный оптимум
  • иногда задача неразрешима в заданных условиях
  • обычно в итоге приходят к кластеру

Рассматривали партицирование данных:

  • горизонтальное-вертикальное
  • ручное
  • автоматическое

Далее был рассказ про CAP-теорему, на середине которого я сбежал на другой доклад.