Nous entrons dans une période d’avant-garde, alimentée par les progrès de la robotique, l’adoption d’appareils domestiques intelligents, les magasins de détail intelligents, la technologie de la voiture autonome, etc. L’apprentissage des machines est à l’avant-garde de toutes ces avancées technologiques d’un nouvel âge. Le développement de machines automatisées capables d’égaler, voire de dépasser, l’intelligence humaine dans les années à venir. L’apprentissage automatique est sans aucun doute la prochaine « grande » chose. Et, on pense que la plupart des technologies futures y seront accrochées.
Pourquoi l’apprentissage automatique est-il important ?
On accorde beaucoup d’importance à l’apprentissage automatique parce qu’il aide à prophétiser les comportements et à repérer les modèles que les humains ne parviennent pas à prévoir. L’apprentissage automatique a une myriade d’applications pratiques très utiles. Grâce à l’apprentissage automatique, il est possible de gérer des scénarios autrefois déconcertants.
3 leçons révolutionnaires sur l’apprentissage automatique
Les algorithmes d’apprentissage automatique sont capables de trouver des moyens d’exécuter les tâches nécessaires simplement en généralisant à partir de scénarios. C’est plus pratique et plus rentable, alors que la programmation manuelle n’est pas si rentable et réalisable. La quantité croissante de « données disponibles » ne manquera pas de susciter un plus grand nombre de problèmes liés aux données saisies. Par conséquent, l’apprentissage automatique est la chose de l’avenir car il sera largement utilisé en informatique et dans d’autres domaines. Bien que, le développement d’applications efficaces d’apprentissage automatique nécessite une quantité considérable d' »art noir » qui n’est pas si facile à trouver dans les manuels.
Les 6 leçons les plus précieuses sur l’apprentissage automatique sont énumérées ci-dessous:
1. La généralisation est le noyau
L’une des caractéristiques les plus fondamentales de l’apprentissage automatique est que l’algorithme doit généraliser à partir des données de la formation au domaine complet de tous les scénarios inédits dans le domaine afin qu’il puisse faire des extrapolations correctes lorsque vous utilisez le modèle. Ce processus de généralisation nécessite que les données que nous utilisons pour former le modèle constituent un échantillon décent et fiable des interprétations de la cartographie que nous souhaitons que l’algorithme apprenne. Plus la qualité et la représentativité sont élevées, plus il sera facile pour le modèle de comprendre la « vraie » cartographie non identifiée et fondamentale qui subsiste entre les entrées et les sorties. La généralisation est l’acte de passer de quelque chose de précis à quelque chose de large.
L’algorithme d’apprentissage machine est les techniques de simplifier automatiquement à partir de scénarios historiques. Ils ont la capacité de généraliser sur une plus grande quantité de données et un taux plus rapide.
L’erreur la plus générale que tous les débutants en apprentissage automatique font généralement est de tester sur des données de formation, et jusqu’à avoir l’impression de réussir. Si le classificateur sélectionné est ensuite essayé sur de nouvelles données, il n’est généralement pas meilleur qu’une estimation aléatoire. Donc, si vous chargez quelqu’un de développer un classificateur, assurez-vous de garder un peu de données avec vous. De plus, essayez de tester le classificateur qu’il vous donne sur celles-ci.
2. Apprentissage = Représentation + Évaluation + Optimisation
Un algorithme ML se décompose en 3 parties ; représentation, évaluation et optimisation.
Représentation:Les données doivent être versées dans une forme algorithmique appropriée. Pour la classification de texte, on peut extraire des caractéristiques de vos entrées de texte intégral et les mouler dans une représentation de sac de mots. Inversement, le choix d’une représentation est synonyme de choix de l’ensemble des classificateurs qu’elle peut éventuellement apprendre. Cet ensemble est nommé comme l’espace d’hypothèse de l’apprenant.
Évaluation : C’est une mesure qui nous aide à comprendre ce que nous faisons en ce moment. Un processus d’évaluation est nécessaire pour différencier les bons classificateurs des moins bons.
Optimisation :Il s’agit du processus consistant à trouver des moyens de sélectionner des techniques variées pour l’optimiser. Par exemple, nous pouvons simplement essayer toutes les hypothèses de notre espace d’hypothèses. Sinon, nous pouvons aussi choisir d’utiliser une technique beaucoup plus intelligente pour essayer uniquement l’hypothèse la plus favorable. En outre, lors de l’optimisation, nous pouvons utiliser la fonction d’évaluation pour comprendre si cette hypothèse spécifique est bonne ou non. La technique d’optimisation permet à l’utilisateur d’en savoir plus sur le classificateur créé si la fonction d’évaluation a obtenu plus d’un optimum. Tout d’abord, les débutants devraient commencer avec les optimiseurs sur étagère, et plus tard, ils peuvent passer à ceux conçus sur mesure.
3. Les données seules ne peuvent pas faire le travail!
La généralisation est le but principal cependant, il a une préoccupation majeure que seules les données ne sont pas suffisantes, indépendamment de la quantité. Cependant, heureusement, les fonctions que nous voulons maîtriser ne sont pas tirées uniformément du bouquet de toutes les fonctions arithmétiquement possibles ! Même les hypothèses les plus générales, y compris la régularité, les exemples similaires ayant des classes analogues, les dépendances inadéquates ou la complexité restreinte, sont généralement suffisantes pour bien fonctionner, et c’est l’une des principales raisons qui rendent l’apprentissage automatique si puissant. Fondamentalement, tous les débutants syndiquent les connaissances avec les Big data pour produire des programmes.