Данные:
DB1 <- data.frame(orderItemID = 1:10,
orderDate = c("2013-01-21","2013-03-31","2013-04-12","2013-06-01","2014-01-01", "2014-02-19","2014-02-27","2014-10-02","2014-10-31","2014-11-21"),
deliveryDate = c("2013-01-23", "2013-03-01", "NA", "2013-06-04", "2014-01-03", "NA", "2014-02-28", "2014-10-04", "2014-11-01", "2014-11-23"))
Ожидаемый результат:
DB1 <- data.frame(orderItemID = 1:10,
orderDate= c("2013-01-21","2013-03-31","2013-04-12","2013-06-01","2014-01-01", "2014-02-19","2014-02-27","2014-10-02","2014-10-31","2014-11-21"),
deliveryDate = c("2013-01-23", "2013-03-01", "2013-04-14", "2013-06-04", "2014-01-03", "2014-02-21", "2014-02-28", "2014-10-04", "2014-11-01", "2014-11-23"))
Привет, ребята, это снова я ;) и, к сожалению (я думаю), у меня довольно сложный вопрос... Как вы можете видеть выше, у меня есть некоторые пропущенные значения в датах доставки, и я хочу заменить их на другую дату. Эта дата должна быть датой заказа определенного товара + среднее время доставки в (полных) днях. (В примере это 1,75 дня, поэтому округляется до 2 дней) Среднее время доставки — это время, рассчитанное из среднего значения всех выборок, не содержащих пропущенных значений = (2дня+1день+3дня+2дня+1дня+2дня+1дня +2дня):8=1,75
поэтому на первом этапе необходимо рассчитать среднее время доставки, а на втором этапе необходимо ввести дату заказа + среднее время доставки (в полных днях) вместо NA
Я уже немного пробовал с [is.na(DB1$deliveryDate)], но, к сожалению, понятия не имею, как решить проблему...
Надеюсь, у кого-то есть идея
c(...). Кроме того, вы рассматриваете даты в немецком формате как символы. - person smci   schedule 18.07.2015