Публикации по теме 'encoding'
Горячее кодирование в машинном обучении (для начинающих)
Введение в работу с категориальными данными в машинном обучении с использованием метода One-Hot Encoding.
Оглавление
Введение Что такое горячее кодирование? Преимущества недостатки Варианты использования горячего кодирования Заключение Рекомендации
1. Введение
Многие наборы реальных данных содержат категориальную информацию, такую как «возраст», «место рождения», «профессия» и т. д. Эти функции могут быть очень полезны при подготовке данных для анализа или разработки..
Целевая функция кодирования с R
Люди любят слова и обычно используют их для представления и описания данных (категориальных признаков). К сожалению, алгоритмы машинного обучения не разделяют нашей страсти к словам, они предпочитают числа. Вот почему на этапе предварительной обработки, прежде чем мы снабдим нашу модель ML для прогнозирования, необходимо закодировать категориальные признаки.
Кодирование — это, по сути, присвоение продуманного номера каждой категории функции. Существует множество методов, наиболее..
что такое горячее кодирование и как это сделать?
поэтому всякий раз, когда мы изучаем какой-либо алгоритм машинного обучения, широко используется термин горячее кодирование. Так что это такое и как это сделать?
Прежде всего, горячее кодирование - это метод, с помощью которого мы преобразуем категориальные данные в числовые данные. мы выполняем представление данных каждой категории в двоичном виде.
посмотрите для примера, предположим, что у нас есть данные об учащихся с их рейтингами как,
после одного горячего кодирования это..
Что такое One Hot Encoding и как это сделать
Если вы занимаетесь машинным обучением, вы неизбежно столкнетесь с такой штукой, которая называется «One Hot Encoding». Однако это одна из тех вещей, которые трудно понять новичку в машинном обучении, поскольку вам нужно кое-что знать о машинном обучении, чтобы понять его. Чтобы помочь, я решил попытаться дать объяснение для новичков.
Когда вы создаете какую-либо программу машинного обучения, первое, что вы делаете, - это, как правило, предварительная обработка. Под этим я подразумеваю..
Вопросы по теме 'encoding'
Работа со строкой, содержащей несколько кодировок символов
Я не совсем уверен, как задать этот вопрос на самом деле, и я не близок к тому, чтобы найти ответ, поэтому я надеюсь, что кто-то может мне помочь.
Я пишу приложение Python, которое подключается к удаленному хосту и получает обратно байтовые данные,...
3026 просмотров
schedule
16.11.2022
Как преобразовать (транслитерировать) строку из utf8 в ASCII (один байт) в С#?
У меня есть строковый объект
"с несколькими символами и даже специальными символами"
я пытаюсь использовать
UTF8Encoding utf8 = new UTF8Encoding();
ASCIIEncoding ascii = new ASCIIEncoding();
объекты, чтобы преобразовать эту строку в...
113683 просмотров
schedule
21.10.2023
Можно ли в URL-адресе содержать пробел?
Разрешено ли URI (в частности, URL-адрес HTTP) содержать один или несколько пробелов? Если URL-адрес необходимо закодировать, является ли + просто общепринятым соглашением или законной альтернативой?
В частности, может ли кто-нибудь указать на...
230935 просмотров
schedule
08.02.2024
отображать китайский иероглиф в выводе консоли eclipse
Я пытаюсь отобразить некоторые китайские символы в кодировке GB2312 в консоли eclipse. Я понимаю, что в диалоговом окне «Выполнить» -> вкладка «Общие» -> «Кодировка консоли» я могу выбрать дополнительные кодировки, отличные от CP1252 по умолчанию....
7609 просмотров
schedule
15.03.2024
Как перенаправить на URL-адрес, содержащий якорь (#)?
Мне нужно взять стандартные входящие URL-адреса и переписать перенаправить их на определенные якоря на одной странице (имя входящей html-страницы становится именем якоря). Например, правило будет таким:
RewriteRule...
3899 просмотров
schedule
16.11.2022
Запись текстового файла из VB.NET (кодировка)
Я пишу приложение, которое должно генерировать простой текстовый файл со столбцами фиксированного размера.
Мой текущий код:
Dim MyFilePath As String = Path & FILE_PREFIX & FileNr & ".TXT"
IO.File.Delete(MyFilePath)
Dim FileStr As...
12136 просмотров
schedule
03.03.2024
Что является обратной стороной (ArrayList).toString для Java ArrayList?
Я использую метод toString ArrayList для хранения данных ArrayList в строке. У меня вопрос, как мне пойти другим путем? Существует ли существующий метод, который будет анализировать данные в экземпляре String обратно в ArrayList ?
10159 просмотров
schedule
05.04.2024
Кодировка символов фиксированного размера
Я разрабатываю в VB.Net приложение, которое читает текстовые файлы с использованием объекта FileStream . Я не использую StreamReader , так как буферизация делает невозможным использование Seek .
Эти текстовые файлы образуют базу данных с...
358 просмотров
schedule
24.04.2024
Используя Ruby 1.9.1, как я могу получить доступ к символам этой строки по одному?
Я не знаю, как еще объяснить, поэтому я дам вам Список греческих слов с английскими производными . Посмотрите на таблицу a , пожалуйста, первый столбец. Обратите внимание, что есть такие слова, как ἄβαξ . Используя Ruby 1.9.1, который имеет...
263 просмотров
schedule
28.12.2023
У каких поставщиков/компаний есть решения для многопоточных видеокодеков?
Если это не актуально здесь, пожалуйста. переместите в правильное место.
Я хочу узнать, какие все поставщики/компании разработали многопоточные видеокодеки (декодеры, кодировщики) как коммерческие продукты? Не решения с открытым исходным кодом,...
1044 просмотров
schedule
31.08.2022
Ошибка «ASCII» в Unicode в python при попытке прочитать строку в кодировке latin-1
У меня возникла проблема при попытке применить регулярное выражение к некоторым строкам, закодированным в латинице-1 (ISO-8859-1).
То, что я пытаюсь сделать, это отправить некоторые данные через HTTP POST со страницы, закодированной в ISO-8859-1, в...
934 просмотров
schedule
17.03.2024
Целочисленное кодирование переменной длины
Я пытаюсь перепроектировать алгоритм декомпрессии LZ1/LZ77. Длина выводимой области буфера/окна декодирования кодируется в файле как целое число переменной длины. Я прочитал все, что мог, о целочисленном кодировании переменной длины, и метод,...
2852 просмотров
schedule
04.09.2022
Проблема с кодировкой строки NSTask
В моей программе я grep-ing через NSTask. По какой-то причине иногда я не получал никаких результатов (хотя код, по-видимому, был таким же, как и команда, запускаемая из CLI, которая работала просто отлично), поэтому я проверил свой код и обнаружил в...
723 просмотров
schedule
30.06.2022
nsxmlparser iphone, анализирующий RSS, вызывает проблемы с кодированием
Я работаю над простым RSS-ридером. Этот ридер загружает данные из Интернета через этот код:
NSXMLParser *rss = [[NSXMLParser alloc] initWithURL:[NSURL URLWithString:@"http://twitter.com/statuses/user_timeline/50405236.rss"]];
Моя проблема с...
1217 просмотров
schedule
24.04.2024
Строки в кодировке ASCII и UTF8 имеют разную длину!
Я читаю поток и мне интересно, почему строка в кодировке UTF-8 короче, чем в ASCII.
ASCIIEncoding encoder = new ASCIIEncoding();
UTF8Encoding enc = new UTF8Encoding();
string response = encoder.GetString(message, 0, bytesRead); //4096...
5359 просмотров
schedule
03.08.2022
Почему MySQL использует latin1_swedish_ci по умолчанию?
Кто-нибудь знает, почему latin1_swedish используется по умолчанию для MySQL. Мне кажется, что UTF-8 будет более совместим, верно?
Значения по умолчанию обычно выбираются потому, что они являются лучшим универсальным выбором, но в данном случае,...
59277 просмотров
schedule
25.08.2022
Не могу вставить русский текст в SQL server 2005 db
Я использую хранимые процедуры и DataContext для вставки данных в базу данных SQL Server (база данных ASP.NET 4 + SQL Server 2005, хостинг GoDaddy)
Но после вставки русского текста вижу что-то вроде этого - '??????'
Если я вставляю постоянный...
1423 просмотров
schedule
30.01.2024
sitemesh и кодировка UTF-8
У меня есть приложение spring-mvc, использующее sitemesh. У меня проблема в том, что мои страницы должны быть в кодировке UTF-8, но sitemesh поддерживает кодировку ISO-8859-1. Можно ли настроить Sitemesh для работы со страницами UTF-8? Я использую...
2093 просмотров
schedule
18.02.2024
Важность набора символов по умолчанию
У меня есть таблица размером 4 ГБ, и для кодировки по умолчанию установлено значение utf8, хотя я сохраняю только символы latin1. Я изменил его на latin1, используя оператор alter table на тестовой машине. Индексный файл log_details.MYI был уменьшен...
926 просмотров
schedule
31.08.2022
Установить кодировку для книги Excel POI Apache
Я использую библиотеку Apache POI для создания и заполнения листа Excel на C # .NET.
Однако проблема, с которой я столкнулся, заключается в том, что данные, которыми я заполняю свою книгу, содержат некоторые специальные символы (например, é, á, í и...
2524 просмотров
schedule
12.11.2022