У меня есть такие структурные данные (веб-посетители)
List(p1,p1,p1,p2,p3,p3,p4,p4,p5...)
один посетитель может посетить 1 --> много раз
объемы данных: около 100 млн/день
Как насчет того, в какой базе данных я могу хранить уникальных посетителей для быстрого доступа (почти в реальном времени) вот так
2014-11-15 | p1 | p2 | p3 | ...| pn
Я пытаюсь обойти это, используя Cassandra, используя такую таблицу:
CREATE TABLE uniqueVisitor (
key text,
p text,
PRIMARY KEY (key, data)
)
Я думаю, что этот шаблон магазина не очень хорошо работает, потому что:
Из-за секционирования данных этой таблицы все данные ключа будут храниться только на одном сервере (с коэффициентом репликации =1) ==> слишком много запросов на запись могут вывести из строя сервер, на котором хранится этот ключ.
Пожалуйста, предложите мне решение (схема хранения)