Хранение опросов в CouchDB против MySQL

Я ищу лучшие способы хранения опросов в базе данных с помощью Rails. Я проверил этот замечательный плагин Smerf Survey для Rails, который хранит опросы в реляционной базе данных со следующими таблицы:


smerf_forms: name, code
smerf_forms_users: user_id, smerf_form_id, responses (as text)
smerf_responses: smerf_forms_user_id, question_code, response (as text)

Глядя на журнал базового примера опроса, поставляемого со Smerf, можно увидеть несколько вызовов базы данных:


Processing SmerfFormsController#create (for 127.0.0.1 at 2010-01-24 20:09:58) [POST]
  Parameters: {"responses"=>{"g1q3a4s1"=>"", "g1q1a3s1a3s1"=>"", "g1q1"=>"1", "g2q1"=>{"1"=>"1"}, "g1q2"=>"2", "g1q3"=>{"1"=>"1", "2"=>"2", "3"=>"3"}, "g2q3"=>"12", "g1q4"=>["4"], "g1q5"=>["1", "3"], "g2q1a4s1"=>""}, "commit"=>"Press to Save your answers", "authenticity_token"=>"a4aDgvjzX0UK9HrQFdpdPyfALWGL22rcjRZfxDY3Ww0=", "smerf_form_id"=>"1"}
  SmerfForm Load (1.0ms)   SELECT * FROM "smerf_forms" WHERE ("smerf_forms"."id" = 1) 
  SmerfFormsUser Create (0.5ms)   INSERT INTO "smerf_forms_users" ("responses", "smerf_form_id", "user_id") VALUES('--- !map:HashWithIndifferentAccess 
g1q3a4s1: ""
g1q1: "1"
g1q1a3s1a3s1: ""
g1q2: "2"
g2q1: !map:HashWithIndifferentAccess 
 "1": "1"
g1q3: !map:HashWithIndifferentAccess 
 "1": "1"
 "2": "2"
 "3": "3"
g1q4: 
- "4"
g2q3: "12"
g1q5: 
- "1"
- "3"
g2q1a4s1: ""
', 1, -1)
  SmerfResponse Create (0.2ms)   INSERT INTO "smerf_responses" ("response", "smerf_forms_user_id", "question_code") VALUES('1', 1, 'g1q1')
  SmerfResponse Create (0.1ms)   INSERT INTO "smerf_responses" ("response", "smerf_forms_user_id", "question_code") VALUES('2', 1, 'g1q2')
  SmerfResponse Create (0.1ms)   INSERT INTO "smerf_responses" ("response", "smerf_forms_user_id", "question_code") VALUES('1', 1, 'g2q1')
  SmerfResponse Create (0.1ms)   INSERT INTO "smerf_responses" ("response", "smerf_forms_user_id", "question_code") VALUES('1', 1, 'g1q3')
  SmerfResponse Create (0.3ms)   INSERT INTO "smerf_responses" ("response", "smerf_forms_user_id", "question_code") VALUES('2', 1, 'g1q3')
  SmerfResponse Create (0.1ms)   INSERT INTO "smerf_responses" ("response", "smerf_forms_user_id", "question_code") VALUES('3', 1, 'g1q3')
  SmerfResponse Create (0.1ms)   INSERT INTO "smerf_responses" ("response", "smerf_forms_user_id", "question_code") VALUES('4', 1, 'g1q4')
  SmerfResponse Create (0.1ms)   INSERT INTO "smerf_responses" ("response", "smerf_forms_user_id", "question_code") VALUES('12', 1, 'g2q3')
  SmerfResponse Create (0.1ms)   INSERT INTO "smerf_responses" ("response", "smerf_forms_user_id", "question_code") VALUES('1', 1, 'g1q5')
  SmerfResponse Create (0.1ms)   INSERT INTO "smerf_responses" ("response", "smerf_forms_user_id", "question_code") VALUES('3', 1, 'g1q5')
Rendering smerf_forms/edit
Rendered smerf_forms/_smerf_form (11.0ms)
Completed in 51ms (View: 17, DB: 3) | 200 OK [http://localhost/smerf_forms]

Мой вопрос: было бы лучше хранить опросы с использованием CouchDB (документно-ориентированной базы данных) вместо реляционной базы данных, поскольку опросы - это больше документов, чем что-либо еще? В связи с этим возникают следующие вопросы:

  • В порядке ли вышеприведенный вывод, следует ли его более оптимизировать? Я имею в виду, что люди не будут заполнять опросы постоянно, поэтому им не нужно работать молниеносно, поэтому мне интересно, действительно ли CouchDB будет быстрее
  • Он уже хорошо построен с этим плагином, так что я должен просто использовать его или было бы реальным преимуществом иметь это в CouchDB. Я хочу провести БОЛЬШОЙ анализ данных этого опроса (много поисков, сортировки, объединения ...).

Спасибо за помощь.

Все еще пытаюсь понять, когда и где использовать CouchDB :)


person Lance Pollard    schedule 25.01.2010    source источник


Ответы (5)


Я категорически не согласен с комментариями Сэма:

  • Опрос и ответ на опрос - отличные примеры документов. Фактически smerf загружает определение формы из файла YAML на диске, и, хотя я совсем не знаком с smerf, я предполагаю, что smerf_forms_users.responses - это сериализованный набор ответов.
  • База данных, ориентированная на документы, не означает, что данные нельзя анализировать. CouchDB и MongoDB имеют механизмы для извлечения и анализа информации, скрытой глубоко внутри документов.

Также обратите внимание, что при сериализации определения формы в YAML в любом случае не остается связи между вопросами и ответами, поэтому, возможно, это не реляционное решение. (Я бы сделал то же самое, если бы использовал для этого RDMBS - представьте схему!)

В базе данных, ориентированной на документы, скорее всего, будут документы опроса (по одному на опрос) и документы ответов на опрос (по одному на пользователя на опрос). Просто и чисто.

Однако, несмотря на то, что я думаю, что база данных документов была бы подходящей, я согласен с комментарием Тоби о том, что если крепостной работает, используйте его, а не добавляйте дополнительную сложность.

Что касается того, что лучше - CouchDB против MongoDB - это частично личные предпочтения, а частично требования.

person Matt Goodall    schedule 25.01.2010

Опросы - это не документы, это набор вопросов с множеством наборов ответов. Ключевой момент заключается в том, что когда вы запускаете опрос, вы хотите не просто сохранять результаты, а анализировать их. Если рассматривать результаты как единый документ, это затруднит анализ. Наличие данных в реляционной базе данных упростит анализ.

person Samuel Neff    schedule 25.01.2010

Опросы отлично подходят для баз данных документов. Главное, что нужно спросить себя: "Может ли хранение этого файла в формате JSON облегчить мне жизнь?"

Meebo, помимо прочего, использует CouchDB для ответов на опросы. Они хранят более 160 миллионов документов в кластере CouchDB-Lounge.

@Toby - это вопрос компромиссов. С CouchDB вы получаете доказанную надежность и масштабируемость, репликацию, которой нет ни в одной другой базе данных, и все это через HTTP. С MySQL или Mongo вы получаете быстрые результаты для нескольких пользователей и некоторую форму автоматического планирования индексации / запросов.

person J Chris A    schedule 30.01.2010

Если плагин опроса сейчас работает, я бы использовал его как есть.

Добавление еще одной системы баз данных в ваше приложение потребует много дополнительной работы ... время разработки, плюс развертывание и системное администрирование.

Вдобавок я просто не думаю, что CouchDB так же хорош, как некоторые из альтернатив ... Я обнаружил, что MongoDB работает быстрее и полезнее (специальные запросы, которые действительно работают для начала). MogoDB также имеет несколько выдающихся библиотек поддержки для Rails.

person Toby Hede    schedule 25.01.2010

Zodiac.NET - хороший пример хранения опросов. Он использует XML для определения опроса:

http://www.mentor-logic.com/index.php/products/components/zodiacnet

person mohammedn    schedule 15.02.2010