Публикации по теме 'encoding'


Горячее кодирование в машинном обучении (для начинающих)
Введение в работу с категориальными данными в машинном обучении с использованием метода One-Hot Encoding. Оглавление Введение Что такое горячее кодирование? Преимущества недостатки Варианты использования горячего кодирования Заключение Рекомендации 1. Введение Многие наборы реальных данных содержат категориальную информацию, такую ​​как «возраст», «место рождения», «профессия» и т. д. Эти функции могут быть очень полезны при подготовке данных для анализа или разработки..

Целевая функция кодирования с R
Люди любят слова и обычно используют их для представления и описания данных (категориальных признаков). К сожалению, алгоритмы машинного обучения не разделяют нашей страсти к словам, они предпочитают числа. Вот почему на этапе предварительной обработки, прежде чем мы снабдим нашу модель ML для прогнозирования, необходимо закодировать категориальные признаки. Кодирование — это, по сути, присвоение продуманного номера каждой категории функции. Существует множество методов, наиболее..

что такое горячее кодирование и как это сделать?
поэтому всякий раз, когда мы изучаем какой-либо алгоритм машинного обучения, широко используется термин горячее кодирование. Так что это такое и как это сделать? Прежде всего, горячее кодирование - это метод, с помощью которого мы преобразуем категориальные данные в числовые данные. мы выполняем представление данных каждой категории в двоичном виде. посмотрите для примера, предположим, что у нас есть данные об учащихся с их рейтингами как, после одного горячего кодирования это..

Что такое One Hot Encoding и как это сделать
Если вы занимаетесь машинным обучением, вы неизбежно столкнетесь с такой штукой, которая называется «One Hot Encoding». Однако это одна из тех вещей, которые трудно понять новичку в машинном обучении, поскольку вам нужно кое-что знать о машинном обучении, чтобы понять его. Чтобы помочь, я решил попытаться дать объяснение для новичков. Когда вы создаете какую-либо программу машинного обучения, первое, что вы делаете, - это, как правило, предварительная обработка. Под этим я подразумеваю..

Вопросы по теме 'encoding'

Работа со строкой, содержащей несколько кодировок символов
Я не совсем уверен, как задать этот вопрос на самом деле, и я не близок к тому, чтобы найти ответ, поэтому я надеюсь, что кто-то может мне помочь. Я пишу приложение Python, которое подключается к удаленному хосту и получает обратно байтовые данные,...
3026 просмотров
schedule 16.11.2022

Как преобразовать (транслитерировать) строку из utf8 в ASCII (один байт) в С#?
У меня есть строковый объект "с несколькими символами и даже специальными символами" я пытаюсь использовать UTF8Encoding utf8 = new UTF8Encoding(); ASCIIEncoding ascii = new ASCIIEncoding(); объекты, чтобы преобразовать эту строку в...
113683 просмотров
schedule 21.10.2023

Можно ли в URL-адресе содержать пробел?
Разрешено ли URI (в частности, URL-адрес HTTP) содержать один или несколько пробелов? Если URL-адрес необходимо закодировать, является ли + просто общепринятым соглашением или законной альтернативой? В частности, может ли кто-нибудь указать на...
230935 просмотров
schedule 08.02.2024

отображать китайский иероглиф в выводе консоли eclipse
Я пытаюсь отобразить некоторые китайские символы в кодировке GB2312 в консоли eclipse. Я понимаю, что в диалоговом окне «Выполнить» -> вкладка «Общие» -> «Кодировка консоли» я могу выбрать дополнительные кодировки, отличные от CP1252 по умолчанию....
7609 просмотров
schedule 15.03.2024

Как перенаправить на URL-адрес, содержащий якорь (#)?
Мне нужно взять стандартные входящие URL-адреса и переписать перенаправить их на определенные якоря на одной странице (имя входящей html-страницы становится именем якоря). Например, правило будет таким: RewriteRule...
3899 просмотров
schedule 16.11.2022

Запись текстового файла из VB.NET (кодировка)
Я пишу приложение, которое должно генерировать простой текстовый файл со столбцами фиксированного размера. Мой текущий код: Dim MyFilePath As String = Path & FILE_PREFIX & FileNr & ".TXT" IO.File.Delete(MyFilePath) Dim FileStr As...
12136 просмотров
schedule 03.03.2024

Что является обратной стороной (ArrayList).toString для Java ArrayList?
Я использую метод toString ArrayList для хранения данных ArrayList в строке. У меня вопрос, как мне пойти другим путем? Существует ли существующий метод, который будет анализировать данные в экземпляре String обратно в ArrayList ?
10159 просмотров
schedule 05.04.2024

Кодировка символов фиксированного размера
Я разрабатываю в VB.Net приложение, которое читает текстовые файлы с использованием объекта FileStream . Я не использую StreamReader , так как буферизация делает невозможным использование Seek . Эти текстовые файлы образуют базу данных с...
358 просмотров
schedule 24.04.2024

Используя Ruby 1.9.1, как я могу получить доступ к символам этой строки по одному?
Я не знаю, как еще объяснить, поэтому я дам вам Список греческих слов с английскими производными . Посмотрите на таблицу a , пожалуйста, первый столбец. Обратите внимание, что есть такие слова, как ἄβαξ . Используя Ruby 1.9.1, который имеет...
263 просмотров
schedule 28.12.2023

У каких поставщиков/компаний есть решения для многопоточных видеокодеков?
Если это не актуально здесь, пожалуйста. переместите в правильное место. Я хочу узнать, какие все поставщики/компании разработали многопоточные видеокодеки (декодеры, кодировщики) как коммерческие продукты? Не решения с открытым исходным кодом,...
1044 просмотров

Ошибка «ASCII» в Unicode в python при попытке прочитать строку в кодировке latin-1
У меня возникла проблема при попытке применить регулярное выражение к некоторым строкам, закодированным в латинице-1 (ISO-8859-1). То, что я пытаюсь сделать, это отправить некоторые данные через HTTP POST со страницы, закодированной в ISO-8859-1, в...
934 просмотров
schedule 17.03.2024

Целочисленное кодирование переменной длины
Я пытаюсь перепроектировать алгоритм декомпрессии LZ1/LZ77. Длина выводимой области буфера/окна декодирования кодируется в файле как целое число переменной длины. Я прочитал все, что мог, о целочисленном кодировании переменной длины, и метод,...
2852 просмотров

Проблема с кодировкой строки NSTask
В моей программе я grep-ing через NSTask. По какой-то причине иногда я не получал никаких результатов (хотя код, по-видимому, был таким же, как и команда, запускаемая из CLI, которая работала просто отлично), поэтому я проверил свой код и обнаружил в...
723 просмотров
schedule 30.06.2022

nsxmlparser iphone, анализирующий RSS, вызывает проблемы с кодированием
Я работаю над простым RSS-ридером. Этот ридер загружает данные из Интернета через этот код: NSXMLParser *rss = [[NSXMLParser alloc] initWithURL:[NSURL URLWithString:@"http://twitter.com/statuses/user_timeline/50405236.rss"]]; Моя проблема с...
1217 просмотров

Строки в кодировке ASCII и UTF8 имеют разную длину!
Я читаю поток и мне интересно, почему строка в кодировке UTF-8 короче, чем в ASCII. ASCIIEncoding encoder = new ASCIIEncoding(); UTF8Encoding enc = new UTF8Encoding(); string response = encoder.GetString(message, 0, bytesRead); //4096...
5359 просмотров
schedule 03.08.2022

Почему MySQL использует latin1_swedish_ci по умолчанию?
Кто-нибудь знает, почему latin1_swedish используется по умолчанию для MySQL. Мне кажется, что UTF-8 будет более совместим, верно? Значения по умолчанию обычно выбираются потому, что они являются лучшим универсальным выбором, но в данном случае,...
59277 просмотров
schedule 25.08.2022

Не могу вставить русский текст в SQL server 2005 db
Я использую хранимые процедуры и DataContext для вставки данных в базу данных SQL Server (база данных ASP.NET 4 + SQL Server 2005, хостинг GoDaddy) Но после вставки русского текста вижу что-то вроде этого - '??????' Если я вставляю постоянный...
1423 просмотров

sitemesh и кодировка UTF-8
У меня есть приложение spring-mvc, использующее sitemesh. У меня проблема в том, что мои страницы должны быть в кодировке UTF-8, но sitemesh поддерживает кодировку ISO-8859-1. Можно ли настроить Sitemesh для работы со страницами UTF-8? Я использую...
2093 просмотров
schedule 18.02.2024

Важность набора символов по умолчанию
У меня есть таблица размером 4 ГБ, и для кодировки по умолчанию установлено значение utf8, хотя я сохраняю только символы latin1. Я изменил его на latin1, используя оператор alter table на тестовой машине. Индексный файл log_details.MYI был уменьшен...
926 просмотров
schedule 31.08.2022

Установить кодировку для книги Excel POI Apache
Я использую библиотеку Apache POI для создания и заполнения листа Excel на C # .NET. Однако проблема, с которой я столкнулся, заключается в том, что данные, которыми я заполняю свою книгу, содержат некоторые специальные символы (например, é, á, í и...
2524 просмотров
schedule 12.11.2022