Lousticourses

Lousticourses

Machine learning et courses hippiques
annelange

Bonjour à tous,

J'ai commencé à rédiger quelques articles sur le machine learning et les courses hippiques.

Dans un premier temps, les articles vous montreront comment analyser les données. Par exemple, on verra les différents types de variables. Comment traiter.

Si vous avez votre propre base de données, vous commencez probablement à rencontrer quelques difficultés : vous vous rendez compte que votre ensemble de données est sale, qu'il manque beaucoup de valeurs, que certaines variables contiennent des étiquettes au lieu de chiffres, que d'autres ne correspondent pas aux hypothèses des modèles et, par-dessus tout, vous vous demandez si c'est la bonne façon de coder les choses.

Ce blog vous aidera ! Vous apprendrez une grande variété de techniques d'ingénierie utilisées dans le monde entier dans différentes organisations et dans des concours de science des données, pour nettoyer et transformer vos données et vos variables. Vous pourrez à terme analyser plus facilement les courses hippiques et peut-être trouver plus facilement les gagnants pour le quinté ou le jeu simple.

Qu'allez-vous apprendre ?
J'ai rassemblé une grande collection de techniques d'ingénierie des données, basée sur des articles scientifiques, des livres blancs, des concours de science des données et bien sûr sur ma propre expérience en tant que spécialiste des données.

Plus précisément, vous apprendrez :

• Comment imputer vos données manquantes
• Comment encoder vos variables catégorielles
• Comment transformer vos variables numériques pour qu'elles correspondent aux hypothèses du modèle ML
• Comment convertir vos variables numériques en intervalles discrets
• Comment éliminer les valeurs aberrantes
• Comment traiter les variables de date et d'heure
• Comment traiter les variables mixtes qui contiennent des chaînes de caractères et des chiffres

Tout au long des articles de ce blog, vous allez apprendre de multiples techniques pour chacune des tâches mentionnées, et vous apprendrez à mettre en œuvre ces techniques de manière élégante, efficace et professionnelle, en utilisant Python, NumPy, Scikit-learn, pandas etc…

Vous serez en mesure de mettre en œuvre toutes vos étapes d'ingénierie des fonctionnalités dans un pipeline unique et élégant, qui vous permettra de mettre en production vos modèles prédictifs pour les courses hippiques avec une efficacité maximale.

https://turf-ia.com/presentation-du-jeux-de-donnees-courses-hippiques/

N'hésitez pas à commenter ici ou sur le blog.
Levis707

Merci pour les informations!!!
Foued

annelange

Cette semaine on continue notre exploration avec les variables catégorielles comme la musique ou les hippodromes

https://turf-ia.com/les-variables-categorielles/
Tartuffe

annelange

Cette semaine comment gérer les dates et surtout comment trouver les mois présentant la meilleure réussite.
https://turf-ia.com/les-variables-de-type-date-heure/
annelange


Cette semaine découvrons ce qu'est une variables mixtes.
Les variables mixtes sont celles dont les valeurs contiennent à la fois des chiffres et des étiquettes.

Variables mixtes en machine learning
annelange

Les prochaines semaines, nous allons nous pencher sur les caractéristiques de nos différentes variables hippiques.

Les variables hippiques
annelange

Caractéristiques des variables : La cardinalité

https://turf-ia.com/caracteristiques-des-variables-la-cardinalite/

Apprendre à quantifier la cardinalité
Voir des exemples de variables à cardinalité élevée et faible
Comprendre l’effet de la cardinalité lors de la préparation des trains et des jeux d’essai
Visualiser l’effet de la cardinalité sur les performances du modèle d’apprentissage machine
Kadir

Vous ne disposez pas des permissions nécessaires pour répondre à un sujet de la catégorie Mon message du jour.

Inscrivez-vous au blog

Soyez prévenu par email des prochaines mises à jour

Rejoignez les 574 autres membres