Cómo llegar a un modelo de ciencia de datos justificable

in #ai2 years ago

He estado revisando varios artículos sobre cómo ajustar un modelo de Data Science/ML para obtener la mayor precisión posible. Las diversas técnicas para hacer el preprocesamiento del modelo para eliminar los datos no deseados, completar valores nulos, obtener los hiperparámetros exactos, etc.

1_DREL_AgWG6c1dw1x3Bwjog.webp

Pero no se propuso ningún artículo de manera significativa para ver cómo la persona ha llegado al modelo ajustado "Final", por qué ha elegido solo esos algoritmos específicos y no otros, explicando simultáneamente las diferencias de elegir los algoritmos. No se escribió ningún artículo sobre cómo la elección de diferentes algoritmos o, como puedo decir, el rechazo de algunos algoritmos podría afectar la precisión del modelo ajustado final.

¿Cuáles son los efectos de estos algoritmos en las diferentes etapas de la denominación de creación de modelos: preprocesamiento, selección de funciones, etc.? Nos acaban de dar las técnicas que finalmente funcionaron bien para un conjunto de datos específico.

Por eso estoy aquí para proponer una serie de más de 50 artículos para hacer lo que esta gente no ha hecho.

Las características más destacadas de mis artículos serán:

Conjuntos de datos de diferentes dominios que podrían resolver problemas de la vida real.
Un conjunto de datos pasará por varias rutas y cada ruta tendrá varios algoritmos en cada etapa de construcción del modelo. Esto, a su vez, conducirá a varios "Modelos finales" para un conjunto de datos específico.
Dado que se usarán varios algoritmos para una etapa específica de la construcción del modelo, justificaré con razones por las que se debe usar un algoritmo específico y por qué no se debe usar. Esto, a su vez, nos llevará a ver simultáneamente cuál es el efecto de estos algoritmos en la precisión del modelo final en una ruta específica.
También proporcionaré una estructura alámbrica caprichosa detallada de un conjunto de datos específico que puede darnos una breve idea de lo que se hace en una ruta específica. Qué han usado todos los algoritmos y qué precisión obtuvimos al seguir un camino específico.

Los objetivos que alcanzaré con él son:

Dar a los principiantes una idea para desarrollar el razonamiento detrás del uso y no uso de un algoritmo específico en un conjunto de datos específico.
Revisar y comprender el uso de diferentes algoritmos para ver el encanto del aprendizaje automático.
De esta manera estaré contribuyendo a la comunidad de Machine Learning tanto como sea posible.

De esta manera estaré contribuyendo a la comunidad de Machine Learning tanto como sea posible.

Gracias por leer. Aplaude si te gusta mi enfoque. Asegúrate de comentar si quieres aclarar algo. Asegúrese de seguirme y compartirlo con sus amigos para las próximas actualizaciones. Lo llevaré al mundo real de los conjuntos de datos de ajuste.

Coin Marketplace

STEEM 0.16
TRX 0.15
JST 0.028
BTC 56560.74
ETH 2390.02
USDT 1.00
SBD 2.34