У меня есть следующие данные
my_data=["Sentence1",['a','b','c'],"Sentence2",['d','e'],"Sentence3",['f']]
и хотите преобразовать входные данные в фрейм данных, используя pyspark 2.2 как
---------------------------------
| ID | Sentence | label |
---------------------------------
| 01 | Sentence1 |['a','b','c'] |
| 02 | Sentence2 |['d','e'] |
Но когда сделать это со следующим кодом
from pyspark.sql import Row
to_row = Row('ID','Sentence', 'list')
df = spark.createDataFrame([to_row(i,s,l) for i,s,l in enumerate(my_data)])
Я получаю следующую ошибку
ValueError: недостаточно значений для распаковки (ожидалось 3, получено 2)
Кто-нибудь может мне помочь?