Что такое ленивый прогноз?

LazyPredict дает представление о том, какую модель мл следует использовать для набора данных. В некоторых наборах данных так сложно решить, какая модель мл работает хорошо, а LazyPredict дает такое четкое представление. LazyPredict — это библиотека с открытым исходным кодом, очень популярная среди специалистов по данным. Дизайн LazyPredict использует разные библиотеки мл друг с другом и оценивает частоту ошибок модели мл. LazyPredict использует от самой популярной модели мл до самой неизвестной модели. Существует два типа групп. Один из них классификация, а другой - регрессия. Я приведу примеры, что два типа группы. Я прошёл каждый процесс для готовой к использованию библиотеки мл. Я хочу показать пример кода LazyPredict. Пример первой классификации. Я использую https://www.kaggle.com/datasets/ppb00x/credit-risk-customers эти данные для ленивого классификатора.

clf=LazyClassifier()
modeller, tahmin=clf.fit(X_train, X_test, y_train, y_test)
print(modeller)
100%|██████████| 29/29 [00:02<00:00, 12.77it/s]
Accuracy  Balanced Accuracy  ROC AUC  F1 Score  \
Model
XGBClassifier                      0.83               0.77     0.77      0.83
LGBMClassifier                     0.81               0.74     0.74      0.81
RandomForestClassifier             0.80               0.71     0.71      0.78
QuadraticDiscriminantAnalysis      0.76               0.70     0.70      0.75
GaussianNB                         0.73               0.70     0.70      0.74
ExtraTreesClassifier               0.79               0.69     0.69      0.77
AdaBoostClassifier                 0.76               0.67     0.67      0.74
NuSVC                              0.76               0.67     0.67      0.75
BernoulliNB                        0.74               0.67     0.67      0.74
KNeighborsClassifier               0.74               0.65     0.65      0.73
DecisionTreeClassifier             0.70               0.65     0.65      0.70
NearestCentroid                    0.65               0.65     0.65      0.66
BaggingClassifier                  0.69               0.64     0.64      0.69
LabelPropagation                   0.69               0.63     0.63      0.69
LabelSpreading                     0.69               0.63     0.63      0.69
LinearDiscriminantAnalysis         0.74               0.63     0.63      0.72
SVC                                0.76               0.63     0.63      0.72
ExtraTreeClassifier                0.66               0.63     0.63      0.67
LogisticRegression                 0.73               0.62     0.62      0.71
Perceptron                         0.68               0.61     0.61      0.68
LinearSVC                          0.72               0.60     0.60      0.70
RidgeClassifier                    0.72               0.60     0.60      0.69
CalibratedClassifierCV             0.73               0.59     0.59      0.69
RidgeClassifierCV                  0.72               0.59     0.59      0.69
SGDClassifier                      0.69               0.58     0.58      0.67
PassiveAggressiveClassifier        0.66               0.57     0.57      0.65
DummyClassifier                    0.70               0.50     0.50      0.58

                               Time Taken
Model
XGBClassifier                        1.32
LGBMClassifier                       0.07
RandomForestClassifier               0.12
QuadraticDiscriminantAnalysis        0.01
GaussianNB                           0.01
ExtraTreesClassifier                 0.11
AdaBoostClassifier                   0.07
NuSVC                                0.05
BernoulliNB                          0.01
KNeighborsClassifier                 0.02
DecisionTreeClassifier               0.01
NearestCentroid                      0.01
BaggingClassifier                    0.03
LabelPropagation                     0.04
LabelSpreading                       0.04
LinearDiscriminantAnalysis           0.03
SVC                                  0.04
ExtraTreeClassifier                  0.01
LogisticRegression                   0.01
Perceptron                           0.01
LinearSVC                            0.05
RidgeClassifier                      0.02
CalibratedClassifierCV               0.14
RidgeClassifierCV                    0.01
SGDClassifier                        0.01
PassiveAggressiveClassifier          0.01
DummyClassifier                      0.01

Этот пример является примером регрессии. Я использую https://www.kaggle.com/datasets/sanjeetsinghnaik/most-expensive-footballers-2021 эти данные для ленивого регрессора.

from lazypredict.Supervised import LazyRegressor
reg = LazyRegressor(verbose=0,ignore_warnings=False, custom_metric=None )
reg.fit(X_train, X_test, y_train, y_test)
(                               Adjusted R-Squared  R-Squared  RMSE  Time Taken
 Model
 BayesianRidge                               -0.04       0.03 20.17        0.00
 ElasticNetCV                                -0.04       0.02 20.19        0.03
 LassoLarsIC                                 -0.04       0.02 20.20        0.02
 LassoCV                                     -0.04       0.02 20.21        0.04
 RidgeCV                                     -0.04       0.02 20.21        0.01
 LarsCV                                      -0.04       0.02 20.21        0.01
 LassoLarsCV                                 -0.04       0.02 20.21        0.00
 Ridge                                       -0.04       0.02 20.23        0.01
 TransformedTargetRegressor                  -0.04       0.02 20.23        0.00
 LinearRegression                            -0.04       0.02 20.23        0.01
 Lars                                        -0.04       0.02 20.23        0.02
 SGDRegressor                                -0.04       0.02 20.24        0.01
 ElasticNet                                  -0.05       0.02 20.26        0.00
 TweedieRegressor                            -0.05       0.02 20.26        0.02
 Lasso                                       -0.05       0.01 20.30        0.00
 GammaRegressor                              -0.05       0.01 20.33        0.02
 PoissonRegressor                            -0.06       0.00 20.41        0.00
 OrthogonalMatchingPursuitCV                 -0.08      -0.01 20.58        0.00
 OrthogonalMatchingPursuit                   -0.08      -0.01 20.58        0.02
 DummyRegressor                              -0.10      -0.03 20.79        0.02
 LassoLars                                   -0.10      -0.03 20.79        0.00
 LGBMRegressor                               -0.11      -0.04 20.85        0.03
 HistGradientBoostingRegressor               -0.11      -0.04 20.85        0.19
 AdaBoostRegressor                           -0.12      -0.05 20.94        0.03
 BaggingRegressor                            -0.13      -0.06 21.05        0.02
 NuSVR                                       -0.14      -0.07 21.16        0.00
 RandomForestRegressor                       -0.14      -0.07 21.19        0.12
 HuberRegressor                              -0.15      -0.08 21.24        0.00
 GradientBoostingRegressor                   -0.16      -0.09 21.30        0.02
 KNeighborsRegressor                         -0.17      -0.10 21.41        0.02
 ExtraTreesRegressor                         -0.20      -0.13 21.69        0.09
 XGBRegressor                                -0.23      -0.15 21.96        0.05
 SVR                                         -0.23      -0.16 21.97        0.00
 PassiveAggressiveRegressor                  -0.24      -0.17 22.07        0.01
 LinearSVR                                   -0.25      -0.17 22.13        0.00
 QuantileRegressor                           -0.27      -0.19 22.28        0.31
 MLPRegressor                                -0.29      -0.21 22.46        0.20
 RANSACRegressor                             -0.30      -0.22 22.60        0.03
 GaussianProcessRegressor                    -0.75      -0.65 26.24        0.01
 ExtraTreeRegressor                          -0.84      -0.73 26.87        0.00
 DecisionTreeRegressor                       -0.92      -0.80 27.46        0.00
 KernelRidge                                 -2.97      -2.73 39.47        0.00,
                                Adjusted R-Squared  R-Squared  RMSE  Time Taken
 Model
 BayesianRidge                               -0.04       0.03 20.17        0.00
 ElasticNetCV                                -0.04       0.02 20.19        0.03
 LassoLarsIC                                 -0.04       0.02 20.20        0.02
 LassoCV                                     -0.04       0.02 20.21        0.04
 RidgeCV                                     -0.04       0.02 20.21        0.01
 LarsCV                                      -0.04       0.02 20.21        0.01
 LassoLarsCV                                 -0.04       0.02 20.21        0.00
 Ridge                                       -0.04       0.02 20.23        0.01
 TransformedTargetRegressor                  -0.04       0.02 20.23        0.00
 LinearRegression                            -0.04       0.02 20.23        0.01
 Lars                                        -0.04       0.02 20.23        0.02
 SGDRegressor                                -0.04       0.02 20.24        0.01
 ElasticNet                                  -0.05       0.02 20.26        0.00
 TweedieRegressor                            -0.05       0.02 20.26        0.02
 Lasso                                       -0.05       0.01 20.30        0.00
 GammaRegressor                              -0.05       0.01 20.33        0.02
 PoissonRegressor                            -0.06       0.00 20.41        0.00
 OrthogonalMatchingPursuitCV                 -0.08      -0.01 20.58        0.00
 OrthogonalMatchingPursuit                   -0.08      -0.01 20.58        0.02
 DummyRegressor                              -0.10      -0.03 20.79        0.02
 LassoLars                                   -0.10      -0.03 20.79        0.00
 LGBMRegressor                               -0.11      -0.04 20.85        0.03
 HistGradientBoostingRegressor               -0.11      -0.04 20.85        0.19
 AdaBoostRegressor                           -0.12      -0.05 20.94        0.03
 BaggingRegressor                            -0.13      -0.06 21.05        0.02
 NuSVR                                       -0.14      -0.07 21.16        0.00
 RandomForestRegressor                       -0.14      -0.07 21.19        0.12
 HuberRegressor                              -0.15      -0.08 21.24        0.00
 GradientBoostingRegressor                   -0.16      -0.09 21.30        0.02
 KNeighborsRegressor                         -0.17      -0.10 21.41        0.02
 ExtraTreesRegressor                         -0.20      -0.13 21.69        0.09
 XGBRegressor                                -0.23      -0.15 21.96        0.05
 SVR                                         -0.23      -0.16 21.97        0.00
 PassiveAggressiveRegressor                  -0.24      -0.17 22.07        0.01
 LinearSVR                                   -0.25      -0.17 22.13        0.00
 QuantileRegressor                           -0.27      -0.19 22.28        0.31
 MLPRegressor                                -0.29      -0.21 22.46        0.20
 RANSACRegressor                             -0.30      -0.22 22.60        0.03
 GaussianProcessRegressor                    -0.75      -0.65 26.24        0.01
 ExtraTreeRegressor                          -0.84      -0.73 26.87        0.00
 DecisionTreeRegressor                       -0.92      -0.80 27.46        0.00
 KernelRidge                                 -2.97      -2.73 39.47        0.00)

То есть о ленивых предсказаниях. Я надеюсь, что понимаю очень хорошо.

Что такое ленивый прогноз?

Похожие вопросы