Вопросы по теме 'apache-spark-dataset'
Не найден класс Java, соответствующий Product with Serializable with Base
Я написал two case class , который расширяет базу abstract class . У меня есть два списка каждого класса ( listA и listB ). Когда я хочу объединить эти два списка, я не могу преобразовать окончательный список в набор данных Apache Spark 1.6.1....
4547 просмотров
schedule
20.11.2023
Как преобразовать набор данных в JavaPairRDD?
Существуют методы преобразования набора данных в JavaRDD.
Dataset<Row> dataFrame;
JavaRDD<String> data = dataFrame.toJavaRDD();
Есть ли другие способы конвертировать набор данных в javaPairRDD<Long, Vector> ?
6053 просмотров
schedule
16.04.2024
Spark UDF не работает с нулевыми значениями в поле Double
Я пытаюсь написать UDF искры, который заменяет нулевые значения поля Double на 0,0. Я использую API набора данных. Вот УДФ:
val coalesceToZero=udf((rate: Double) => if(Option(rate).isDefined) rate else 0.0)
Это основано на следующей...
3712 просмотров
schedule
14.09.2022
Как правильно обрабатывать исключение spark.sql.AnalysisException
Я использую Spark Dataset API для выполнения операций с JSON для извлечения определенных полей по мере необходимости. Однако, когда спецификация, которую я предоставляю, чтобы искра знала, какое поле извлекать, идет не так, как надо, искра...
1427 просмотров
schedule
03.08.2022
Spark dataframe во вложенный JSON
У меня есть кадр данных joinDf , созданный путем объединения следующих четырех кадров данных на userId :
val detailsDf = Seq((123,"first123","xyz"))
.toDF("userId","firstName","address")
val emailDf =...
2307 просмотров
schedule
26.07.2022
Передача класса case в аргументы функции
извините за простой вопрос. Я хочу передать класс case в аргумент функции и использовать его дальше внутри функции. До сих пор я пробовал это с TypeTag и ClassTag , но по какой-то причине я не могу правильно его использовать или, может быть, я...
3236 просмотров
schedule
28.02.2024
Как создать набор данных с параметром типа класса case? (Не удалось найти энкодер для типа T)
Я пытаюсь создать набор данных из RDD типа T , который, как известно, является классом case, переданным в качестве параметра моей функции. Проблема в том, что неявные кодировщики здесь не применяются. Как мне установить параметр типа, чтобы иметь...
1050 просмотров
schedule
22.02.2024