Публикации по теме 'information-retrieval'
Как я использовал Marqo для создания многоязычной юридической базы данных в 5 ключевых строках кода
Европейский союз сталкивается со своеобразной проблемой — у него 24 официальных языка в 27 странах, и эти страны должны соблюдать законы ЕС. Перед экспертами в области права ЕС стоит сложная задача навигации по юридическим материалам на нескольких языках.
Что, если бы существовала система, в которой пользователь (например, юрист) мог бы искать в базе данных документы на предпочитаемом им языке и находить наиболее подходящий документ на другом языке? Что, если этот пользователь захочет..
Поисковая система для академических статей по компьютерному зрению
TL; DR
Мы предложили новую поисковую систему для статей, опубликованных в последние годы по ICCV и CVPR. И это работает очень хорошо! Полный код доступен на нашем Github .
Введение
С развитием искусственного интеллекта каждый год публикуются тысячи статей. Как управлять всеми этими бумагами становится проблемой. Кроме того, чтобы лучше использовать эти ценные результаты исследований, как мы можем создать поисковую систему, которая поможет нам быстро и точно найти связанную работу?..
Музыкальная рекомендация с использованием обратной связи по релевантности
В последние годы потоковая передача музыки превратилась в источник развлечения и прибыльную бизнес-стратегию, удовлетворяющую потребности как слушателя, так и провайдера. Популярность потоковых онлайн-сайтов во многом определяется их количеством пользователей, на которое напрямую влияет опыт пользователей. Уровень удовлетворенности пользователей прямо пропорционален успеху музыкальной платформы.
Из-за множества языков и даже большего числа исполнителей поиск песен на свой вкус -..
Поиск текста против поиска из базы данных
В этой статье я буду обсуждать разницу между извлечением текста и извлечением из базы данных.
В этом цифровом мире текстовые данные есть повсюду, от твитов в твиттере до анализа текста в документах, все связано с текстом. Многие продукты, основанные на машинном обучении, эффективно используют эти текстовые данные для создания удивительных технологий, основанных на таких темах, как анализ настроений, моделирование тем, извлечение отношений и т. Д.
Поэтому, поскольку текстовые данные..
Вопросы по теме 'information-retrieval'
Как быстро 2 айфона могут обмениваться информацией о наклоне/положении?
Мне было интересно, сколько времени требуется, чтобы передать информацию о наклоне и положении (не gps) одного конкретного iphone другому. Могут ли 2 iphone отправлять и получать эту информацию одновременно? А 3 айфона? Меня интересует приложение,...
474 просмотров
schedule
07.10.2023
Ответы на вопросы с Lucene
Для игрушечного проекта я хочу реализовать автоматизированную систему ответов на вопросы с помощью Lucene, и я пытаюсь найти разумный способ ее реализации. Основная операция заключается в следующем:
1) Пользователь вводит вопрос.
2) Система...
1154 просмотров
schedule
18.09.2022
Должны ли клиенты иметь прямой доступ к базе данных?
Следует ли программировать клиентские приложения таким образом, чтобы они подключались к удаленной базе данных SQL и извлекали данные из нее?
Основываясь на своих знаниях, я бы сказал, что это очень плохая практика, и у вас должно быть серверное...
1647 просмотров
schedule
06.06.2024
Найти входное изображение (ID, паспорт) в imagesDB на основе сходства
Я хотел бы решить, присутствует ли изображение в списке, хранящемся в БД (например, изображения удостоверений личности, паспорта, карты Stu. и т. д.). Я подумал об использовании алгоритма KNN, который будет отображать K ближайших изображений....
109 просмотров
schedule
01.11.2023
косинусное сходство двух массивов в java
У меня есть 2 файла, содержащие веса терминов, моя цель состоит в том, чтобы вычислить косинусное сходство cos = dotproduct (weight1, weights2) / euclidianDistance (weight1) * euclidianDistance (weight2));
Это мой код:
import java.io.*;
import...
477 просмотров
schedule
27.04.2024
Lucene рассчитать среднюю частоту терминов
В настоящее время я реализую модификацию стандарта Lucene Сходство BM25 , основанное на следующем статье . Реализация фактической формулы проста, но я борюсь с вычислением необходимой статистики.
Мне нужны следующие две статистики:
Средняя...
607 просмотров
schedule
15.02.2024
построить матрицу документа термина из файла PDF
Я пытаюсь построить term document matrix из одного текста в формате PDF. Когда я осматриваю term document matrix , я понимаю это.
<<TermDocumentMatrix (terms: 7245, documents:342)>>
Номер документа должен быть 1, а не 342, а...
128 просмотров
schedule
22.12.2023
Поле Solr _ version _ в качестве метки времени для запроса последних результатов
Можем ли мы использовать поле Solr _ версия _ в качестве метки времени/версии, чтобы мы могли запрашивать последние документы из определенной _ версии _/временной метки?
Мое требование состоит в том, чтобы периодически (ежедневно) извлекать новые...
572 просмотров
schedule
24.05.2024