LazyPredict дает представление о том, какую модель мл следует использовать для набора данных. В некоторых наборах данных так сложно решить, какая модель мл работает хорошо, а LazyPredict дает такое четкое представление. LazyPredict — это библиотека с открытым исходным кодом, очень популярная среди специалистов по данным. Дизайн LazyPredict использует разные библиотеки мл друг с другом и оценивает частоту ошибок модели мл. LazyPredict использует от самой популярной модели мл до самой неизвестной модели. Существует два типа групп. Один из них классификация, а другой - регрессия. Я приведу примеры, что два типа группы. Я прошёл каждый процесс для готовой к использованию библиотеки мл. Я хочу показать пример кода LazyPredict. Пример первой классификации. Я использую https://www.kaggle.com/datasets/ppb00x/credit-risk-customers эти данные для ленивого классификатора.

clf=LazyClassifier()
modeller, tahmin=clf.fit(X_train, X_test, y_train, y_test)
print(modeller)
100%|██████████| 29/29 [00:02<00:00, 12.77it/s]
Accuracy  Balanced Accuracy  ROC AUC  F1 Score  \
Model
XGBClassifier                      0.83               0.77     0.77      0.83
LGBMClassifier                     0.81               0.74     0.74      0.81
RandomForestClassifier             0.80               0.71     0.71      0.78
QuadraticDiscriminantAnalysis      0.76               0.70     0.70      0.75
GaussianNB                         0.73               0.70     0.70      0.74
ExtraTreesClassifier               0.79               0.69     0.69      0.77
AdaBoostClassifier                 0.76               0.67     0.67      0.74
NuSVC                              0.76               0.67     0.67      0.75
BernoulliNB                        0.74               0.67     0.67      0.74
KNeighborsClassifier               0.74               0.65     0.65      0.73
DecisionTreeClassifier             0.70               0.65     0.65      0.70
NearestCentroid                    0.65               0.65     0.65      0.66
BaggingClassifier                  0.69               0.64     0.64      0.69
LabelPropagation                   0.69               0.63     0.63      0.69
LabelSpreading                     0.69               0.63     0.63      0.69
LinearDiscriminantAnalysis         0.74               0.63     0.63      0.72
SVC                                0.76               0.63     0.63      0.72
ExtraTreeClassifier                0.66               0.63     0.63      0.67
LogisticRegression                 0.73               0.62     0.62      0.71
Perceptron                         0.68               0.61     0.61      0.68
LinearSVC                          0.72               0.60     0.60      0.70
RidgeClassifier                    0.72               0.60     0.60      0.69
CalibratedClassifierCV             0.73               0.59     0.59      0.69
RidgeClassifierCV                  0.72               0.59     0.59      0.69
SGDClassifier                      0.69               0.58     0.58      0.67
PassiveAggressiveClassifier        0.66               0.57     0.57      0.65
DummyClassifier                    0.70               0.50     0.50      0.58

                               Time Taken
Model
XGBClassifier                        1.32
LGBMClassifier                       0.07
RandomForestClassifier               0.12
QuadraticDiscriminantAnalysis        0.01
GaussianNB                           0.01
ExtraTreesClassifier                 0.11
AdaBoostClassifier                   0.07
NuSVC                                0.05
BernoulliNB                          0.01
KNeighborsClassifier                 0.02
DecisionTreeClassifier               0.01
NearestCentroid                      0.01
BaggingClassifier                    0.03
LabelPropagation                     0.04
LabelSpreading                       0.04
LinearDiscriminantAnalysis           0.03
SVC                                  0.04
ExtraTreeClassifier                  0.01
LogisticRegression                   0.01
Perceptron                           0.01
LinearSVC                            0.05
RidgeClassifier                      0.02
CalibratedClassifierCV               0.14
RidgeClassifierCV                    0.01
SGDClassifier                        0.01
PassiveAggressiveClassifier          0.01
DummyClassifier                      0.01

Этот пример является примером регрессии. Я использую https://www.kaggle.com/datasets/sanjeetsinghnaik/most-expensive-footballers-2021 эти данные для ленивого регрессора.

from lazypredict.Supervised import LazyRegressor
reg = LazyRegressor(verbose=0,ignore_warnings=False, custom_metric=None )
reg.fit(X_train, X_test, y_train, y_test)
(                               Adjusted R-Squared  R-Squared  RMSE  Time Taken
 Model
 BayesianRidge                               -0.04       0.03 20.17        0.00
 ElasticNetCV                                -0.04       0.02 20.19        0.03
 LassoLarsIC                                 -0.04       0.02 20.20        0.02
 LassoCV                                     -0.04       0.02 20.21        0.04
 RidgeCV                                     -0.04       0.02 20.21        0.01
 LarsCV                                      -0.04       0.02 20.21        0.01
 LassoLarsCV                                 -0.04       0.02 20.21        0.00
 Ridge                                       -0.04       0.02 20.23        0.01
 TransformedTargetRegressor                  -0.04       0.02 20.23        0.00
 LinearRegression                            -0.04       0.02 20.23        0.01
 Lars                                        -0.04       0.02 20.23        0.02
 SGDRegressor                                -0.04       0.02 20.24        0.01
 ElasticNet                                  -0.05       0.02 20.26        0.00
 TweedieRegressor                            -0.05       0.02 20.26        0.02
 Lasso                                       -0.05       0.01 20.30        0.00
 GammaRegressor                              -0.05       0.01 20.33        0.02
 PoissonRegressor                            -0.06       0.00 20.41        0.00
 OrthogonalMatchingPursuitCV                 -0.08      -0.01 20.58        0.00
 OrthogonalMatchingPursuit                   -0.08      -0.01 20.58        0.02
 DummyRegressor                              -0.10      -0.03 20.79        0.02
 LassoLars                                   -0.10      -0.03 20.79        0.00
 LGBMRegressor                               -0.11      -0.04 20.85        0.03
 HistGradientBoostingRegressor               -0.11      -0.04 20.85        0.19
 AdaBoostRegressor                           -0.12      -0.05 20.94        0.03
 BaggingRegressor                            -0.13      -0.06 21.05        0.02
 NuSVR                                       -0.14      -0.07 21.16        0.00
 RandomForestRegressor                       -0.14      -0.07 21.19        0.12
 HuberRegressor                              -0.15      -0.08 21.24        0.00
 GradientBoostingRegressor                   -0.16      -0.09 21.30        0.02
 KNeighborsRegressor                         -0.17      -0.10 21.41        0.02
 ExtraTreesRegressor                         -0.20      -0.13 21.69        0.09
 XGBRegressor                                -0.23      -0.15 21.96        0.05
 SVR                                         -0.23      -0.16 21.97        0.00
 PassiveAggressiveRegressor                  -0.24      -0.17 22.07        0.01
 LinearSVR                                   -0.25      -0.17 22.13        0.00
 QuantileRegressor                           -0.27      -0.19 22.28        0.31
 MLPRegressor                                -0.29      -0.21 22.46        0.20
 RANSACRegressor                             -0.30      -0.22 22.60        0.03
 GaussianProcessRegressor                    -0.75      -0.65 26.24        0.01
 ExtraTreeRegressor                          -0.84      -0.73 26.87        0.00
 DecisionTreeRegressor                       -0.92      -0.80 27.46        0.00
 KernelRidge                                 -2.97      -2.73 39.47        0.00,
                                Adjusted R-Squared  R-Squared  RMSE  Time Taken
 Model
 BayesianRidge                               -0.04       0.03 20.17        0.00
 ElasticNetCV                                -0.04       0.02 20.19        0.03
 LassoLarsIC                                 -0.04       0.02 20.20        0.02
 LassoCV                                     -0.04       0.02 20.21        0.04
 RidgeCV                                     -0.04       0.02 20.21        0.01
 LarsCV                                      -0.04       0.02 20.21        0.01
 LassoLarsCV                                 -0.04       0.02 20.21        0.00
 Ridge                                       -0.04       0.02 20.23        0.01
 TransformedTargetRegressor                  -0.04       0.02 20.23        0.00
 LinearRegression                            -0.04       0.02 20.23        0.01
 Lars                                        -0.04       0.02 20.23        0.02
 SGDRegressor                                -0.04       0.02 20.24        0.01
 ElasticNet                                  -0.05       0.02 20.26        0.00
 TweedieRegressor                            -0.05       0.02 20.26        0.02
 Lasso                                       -0.05       0.01 20.30        0.00
 GammaRegressor                              -0.05       0.01 20.33        0.02
 PoissonRegressor                            -0.06       0.00 20.41        0.00
 OrthogonalMatchingPursuitCV                 -0.08      -0.01 20.58        0.00
 OrthogonalMatchingPursuit                   -0.08      -0.01 20.58        0.02
 DummyRegressor                              -0.10      -0.03 20.79        0.02
 LassoLars                                   -0.10      -0.03 20.79        0.00
 LGBMRegressor                               -0.11      -0.04 20.85        0.03
 HistGradientBoostingRegressor               -0.11      -0.04 20.85        0.19
 AdaBoostRegressor                           -0.12      -0.05 20.94        0.03
 BaggingRegressor                            -0.13      -0.06 21.05        0.02
 NuSVR                                       -0.14      -0.07 21.16        0.00
 RandomForestRegressor                       -0.14      -0.07 21.19        0.12
 HuberRegressor                              -0.15      -0.08 21.24        0.00
 GradientBoostingRegressor                   -0.16      -0.09 21.30        0.02
 KNeighborsRegressor                         -0.17      -0.10 21.41        0.02
 ExtraTreesRegressor                         -0.20      -0.13 21.69        0.09
 XGBRegressor                                -0.23      -0.15 21.96        0.05
 SVR                                         -0.23      -0.16 21.97        0.00
 PassiveAggressiveRegressor                  -0.24      -0.17 22.07        0.01
 LinearSVR                                   -0.25      -0.17 22.13        0.00
 QuantileRegressor                           -0.27      -0.19 22.28        0.31
 MLPRegressor                                -0.29      -0.21 22.46        0.20
 RANSACRegressor                             -0.30      -0.22 22.60        0.03
 GaussianProcessRegressor                    -0.75      -0.65 26.24        0.01
 ExtraTreeRegressor                          -0.84      -0.73 26.87        0.00
 DecisionTreeRegressor                       -0.92      -0.80 27.46        0.00
 KernelRidge                                 -2.97      -2.73 39.47        0.00)

То есть о ленивых предсказаниях. Я надеюсь, что понимаю очень хорошо.