Applies to: CELONIS 4.3 CELONIS 4.4
Description
The Linear Regression function models the relationship between input variables by fitting a linear equation to the input data.
The method consists of two steps. First, a model is trained. Second, values are predicted by the model. Linear Regression is integrated into the existing table framework. Currently, model training and prediction can not be separated.
Функция линейной регрессии моделирует взаимосвязь между входными переменными путем подгонки линейного уравнения к входным данным.
Метод состоит из двух этапов. Сначала модель обучается. Во-вторых, значения прогнозируются моделью. Линейная регрессия интегрирована в существующую структуру таблиц. В настоящее время модели обучения и прогнозирования не могут быть разделены.
Syntax
LINEAR_REGRESSION ( TRAIN_[Filtered_]LM ( INPUT ( table.input_column, ... ), OUTPUT ( table.output_column ) ), PREDICT ( table.predict_column, ... ) ) |
Тренирует модель линейной регрессии.
Данные, по которым обучается линейная модель, фильтруются.
Один или несколько столбцов, которые используются для обучения модели так, чтобы она описывала выходные данные.
Один столбец, через который модель закладывает функцию предиктора.
Один или несколько столбцов, для которых для каждой строки возвращается прогнозируемое значение с применением обученной модели.
All columns in TRAIN_LM have to be joinable. The columns in PREDICT do not have to be joinable with the columns in TRAIN_LM.
The input of the model training is regarded as an independent sub query. This means if an aggregation is used, it is independent of the dimensions defined in the rest of the query. This also means that the columns within TRAIN_LN have to be joinable, but not with the columns used in the rest of the query.
Все столбцы в TRAIN_LM должны быть присоединяемыми. Столбцы в PREDICT не обязательно должны соединяться со столбцами в TRAIN_LM.
Ввод модели обучения рассматривается как независимый подзапрос. Это означает, что если используется агрегация, она не зависит от измерений, определенных в остальной части запроса. Это также означает, что столбцы в TRAIN_LN должны быть присоединяемыми, но не со столбцами, используемыми в остальной части запроса.
Filter behavior
Standard Linear Regression
If rows of a column are filtered, it does not affect the linear model, as long as the linear model is not trained on aggregation results. This means independent of filters and selections, the underlying model stays the same. If you want to restrict the input data of a model you can use a CASE WHEN statement and map the values you want to be ignored to null. If a model is trained on results of an aggregation it still changes with the filtering because the result of the aggregation is affected by the filtering.
Если строки столбца фильтруются, это не влияет на линейную модель, если линейная модель не обучена результатам агрегации. Это означает, что независимо от фильтров и выборок базовая модель остается неизменной. Если вы хотите ограничить входные данные модели, вы можете использовать оператор CASE WHEN и сопоставить значения, которые вы хотите игнорировать, с нулем. Если модель обучается на результатах агрегации, она все еще изменяется с фильтрацией, потому что фильтрация влияет на результат агрегации.
Filtered Linear Regression
If a filter or selection changes, the model is retrained and the resulting function adopts to the new of view of data. This has a serious performance impact.
Если фильтр или выбор изменяется, модель переобучается, и результирующая функция адаптируется к новому представлению данных. Это оказывает серьезное влияние на производительность.
Examples