Dans cet espace, nous explorerons les projets d’intelligence artificielle les plus innovants et les plus percutants, de la recherche de pointe aux applications concrètes. Que vous soyez un passionné de technologie ou simplement curieux de connaître l’avenir de l’IA, vous trouverez de nombreuses idées et perspectives passionnantes pour vous inspirer. Allons-y !
L’intelligence artificielle a eu un impact significatif sur notre vie quotidienne. Chaque fois que vous parcourez les réseaux sociaux, ouvrez Spotify ou effectuez une recherche rapide sur Google, vous utilisez une application d’IA. L’industrie de l’IA s’est considérablement développée ces dernières années et devrait encore croître, pour atteindre environ 126 milliards de dollars d’ici 2025. Des sociétés multinationales comme IBM, Accenture et Apple embauchent activement des praticiens de l’IA. Le salaire médian d’un ingénieur en IA en 2021 est de 171 715 $, pouvant dépasser 250 000 $.
Le domaine de l’IA est vaste et il existe de nombreux domaines au sein de l’industrie dans lesquels vous pouvez choisir de vous spécialiser. Disons que si vous êtes intrigué par les systèmes de reconnaissance faciale et la génération d’images, vous pouvez choisir de travailler dans le domaine de la vision par ordinateur . Si vous souhaitez créer des modèles capables de converser avec les gens et d’apprendre le langage humain, vous pouvez travailler dans le domaine du NLP (Natural Language Processing) .
De nombreux travaux sont réalisés aujourd’hui pour faire progresser l’intelligence artificielle. Les entreprises ont besoin de spécialistes en IA capables de créer et de déployer des modèles évolutifs pour répondre aux demandes croissantes du secteur. Il n’est pas difficile de se lancer dans le domaine de l’IA. Bien qu’il soit complexe de créer des modèles d’apprentissage automatique à partir de zéro, la plupart des emplois en IA dans l’industrie actuelle n’exigent pas que vous connaissiez les mathématiques derrière ces modèles. De nombreuses entreprises ont besoin de personnes capables de créer des solutions d’IA, de les faire évoluer et de les déployer pour l’utilisateur final. De nombreuses bibliothèques et frameworks de haut niveau peuvent vous aider à y parvenir sans une connaissance approfondie du fonctionnement des modèles.
Il existe une variété de projets d’IA que vous pouvez réaliser pour mieux comprendre ces bibliothèques. Si vous cherchez à vous lancer dans l’IA et que vous n’avez pas de qualification professionnelle, la meilleure façon de décrocher un emploi est de présenter des projets d’intelligence artificielle intéressants dans votre portefeuille ou de montrer vos contributions à des projets d’IA open source.
Construire des projets d’intelligence artificielle améliore non seulement vos compétences en tant qu’ingénieur en IA, mais c’est également un excellent moyen de montrer vos compétences en intelligence artificielle à des employeurs potentiels pour décrocher le futur emploi de vos rêves.
Sans plus tarder, explorons 20 projets d’intelligence artificielle que vous pouvez créer et présenter sur votre CV. Ces projets d’IA auront différents niveaux de difficulté… – débutant, intermédiaire et avancé. Les experts du secteur ProjectPro suggèrent de commencer par de simples projets d’intelligence artificielle si vous êtes nouveau dans le secteur de l’IA. Au fur et à mesure que vos compétences progressent, vous pouvez passer à la pratique de projets basés sur l’IA plus avancés .
Télécharger le PDF du mini-projet d’intelligence artificielle
Voici quelques projets sur l’intelligence artificielle dans le domaine qui souhaitent apprendre les concepts de l’IA.
Les recruteurs passent beaucoup de temps à parcourir les CV pour trouver le meilleur candidat pour un poste. Puisqu’il peut y avoir des centaines de candidatures pour un seul poste, ce processus a été automatisé de plusieurs manières : la plus courante est la correspondance de mots clés. Les CV sont présélectionnés et lus par les recruteurs sur la base d’un ensemble de mots-clés trouvés dans le CV du candidat. Dans le cas contraire, le curriculum vitae est rejeté et le candidat est rejeté pour le poste. Cependant, ce processus de sélection présente de nombreux inconvénients. Les candidats connaissent l’algorithme de correspondance des mots clés et nombre d’entre eux insèrent autant de mots clés que possible dans leur CV pour être présélectionnés par l’entreprise.
Vous pouvez créer un analyseur de CV à l’aide de techniques d’intelligence artificielle et d’apprentissage automatique qui peuvent parcourir la candidature d’un candidat et identifier les candidats qualifiés, en filtrant les personnes qui remplissent leur CV avec des mots-clés inutiles.
Vous pouvez utiliser le CV Dataset disponible sur Kaggle pour créer ce modèle. Cet ensemble de données ne contient que deux colonnes : le titre du poste et les informations sur le CV du candidat.
Les données sont présentes sous forme de texte et doivent être prétraitées. Vous pouvez utiliser la bibliothèque NLTK Python à cet effet. Ensuite, vous pouvez créer un algorithme de clustering qui regroupe les mots et les compétences étroitement liés qu’un candidat doit posséder dans chaque domaine. Les mots dont le contexte est similaire (et pas seulement les mots-clés) doivent être pris en compte. Vous pouvez attribuer une note de pondération finale à chaque CV… – de 0 (le moins favorable) à 10 (le plus favorable). C’est le projet le plus convivial pour les débutants si vous souhaitez apprendre l’IA.
Ensemble de données : ensemble de données de reprise Kaggle
Les fausses nouvelles sont des informations trompeuses ou fausses diffusées sous forme d’informations. Il est souvent difficile de faire la distinction entre les fausses et les vraies informations, et ce n’est que lorsque la situation devient disproportionnée qu’elle apparaît au grand jour. La diffusion de fausses nouvelles devient particulièrement dangereuse lors de périodes comme les élections ou les situations de pandémie. Les fausses rumeurs et la désinformation qui mettent des vies humaines en danger menacent les personnes et la société.
Les fausses nouvelles doivent être détectées et évitées le plus tôt possible, avant qu’elles ne provoquent la panique et ne se propagent à un grand nombre de personnes.
Pour ce projet très intéressant, vous construirez un détecteur de fausses nouvelles , vous pourrez utiliser l’ensemble de données Real and Fake News disponible sur Kaggle.
Vous pouvez utiliser un modèle d’apprentissage automatique pré-entraîné appelé BERT pour effectuer cette classification. BERT est un modèle de traitement du langage naturel (NLP) rendu open source. Vous pouvez charger BERT dans Python et simplement ajouter une couche de sortie supplémentaire pour votre tâche de classification de texte .
Si vous souhaitez vous lancer dans le domaine du traitement du langage naturel , vous devriez essayer de créer une application de traduction à l’aide d’un transformateur.
Un modèle de transformateur extrait les caractéristiques des phrases et détermine l’importance de chaque mot dans une phrase. Un transformateur possède un composant de codage et de décodage, tous deux formés de bout en bout.
Vous pouvez créer votre propre application de traduction IA avec un transformateur. Pour ce faire, vous pouvez charger un modèle de transformateur pré-entraîné dans Python. Ensuite, transformez le texte que vous souhaitez traduire en jetons et introduisez-le dans le modèle pré-entraîné.
Vous pouvez utiliser la bibliothèque GluonNLP à cet effet. Vous pouvez également charger l’ensemble de données d’entraînement et de test pour ce projet d’IA à partir de cette bibliothèque.
Paquet Python : GluonNLP
Avez-vous déjà reçu une notification indiquant que quelqu’un a commenté votre publication Instagram ? Vous prenez votre téléphone avec enthousiasme et ouvrez l’application pour découvrir qu’il s’agit d’un robot faisant la promotion d’une marque de chaussures contrefaite. La section commentaires de nombreuses publications Instagram est remplie de robots. Ils peuvent aller d’ennuyeux à dangereux, selon le type d’appel à l’action qu’ils exigent de votre part.
Vous pouvez créer un modèle de détection du spam à l’aide de techniques d’IA pour identifier la différence entre le spam et les commentaires légitimes.
Vous ne pourrez peut-être pas trouver un ensemble de données contenant une collection de commentaires de spam Instagram, mais vous pouvez collecter les données pour cette analyse en grattant le Web. Accédez à l’API Instagram avec Python pour obtenir des commentaires sans étiquette d’Instagram.
Vous pouvez utiliser un autre ensemble de données pour la formation, comme l’ensemble de données de collecte de spam YouTube de Kaggle. Ensuite, utilisez des mots-clés pour classer les mots qui apparaissent couramment dans les commentaires indésirables.
Utilisez une technique telle que N-Gram pour attribuer un poids aux mots qui ont tendance à apparaître dans les commentaires indésirables, puis comparez ces mots avec chaque commentaire récupéré sur le Web. Une autre approche que vous pouvez adopter consiste à utiliser un algorithme basé sur la distance comme la similarité cosinus . Ces approches donneront de meilleurs résultats en fonction du type de prétraitement que vous appliquez.
Si vous supprimez les mots vides, les espaces, la ponctuation et nettoyez correctement les données, vous constaterez que l’algorithme fonctionne mieux car il peut faire correspondre des mots similaires les uns avec les autres.
Vous pouvez également utiliser un modèle pré-entraîné comme ALBERT pour de meilleurs résultats. Bien que les algorithmes de correspondance de distance ou de poids fonctionnent bien pour trouver des mots similaires, ils sont incapables de saisir le contexte d’une phrase.
Les modèles de PNL comme BERT et ALBERT peuvent mieux faire cela, car ils prennent en compte des facteurs tels que le contexte, la cohérence et l’interprétabilité de la phrase.
Rapprochez-vous de votre rêve de devenir un data scientist avec plus de 70 projets de ML de bout en bout résolus
Vous pouvez démontrer des compétences dans le domaine de la vision par ordinateur avec ce projet. Un système de détection d’objets peut identifier des classes d’objets présents dans une image en utilisant des techniques de vision par ordinateur en arrière-plan.
Par exemple, supposons qu’une image contienne une photo de vous travaillant sur un ordinateur portable. Dans ce cas, un système de détection d’objets devrait être capable de vous identifier et de vous identifier (humain) ainsi que l’ordinateur, ainsi que votre position dans l’image.
Vous pouvez utiliser l’ensemble de données de détection d’objets Open Images de Kaggle pour ce projet. Il existe un modèle de détection d’objets pré-entraîné qui a été rendu open source appelé SSD. Ce modèle a été formé sur un ensemble de données d’objets du quotidien appelé COCO et peut identifier des éléments tels que des tables, des chaises et des livres .
Vous pouvez entraîner davantage la couche de sortie de ce modèle sur l’ensemble de données Kaggle Open Images pour créer votre système de détection d’objets avec une grande précision.
Ensemble de données : ensemble de données de détection d’objets Kaggle Open Images
Un autre projet de vision par ordinateur intéressant que vous pouvez réaliser consiste à prédire l’espèce d’un animal à partir d’une image.
Vous pouvez le faire avec l’ensemble de données Animals-10 sur Kaggle. Il existe dix catégories différentes d’animaux dans cet ensemble de données : chien, chat, cheval, araignée, papillon, poulet, mouton, vache, écureuil, éléphant.
Il s’agit d’un problème de classification multi-classes et vous devrez prédire l’espèce de l’animal en fonction de son image dans l’ensemble de données.
Vous pouvez utiliser un modèle pré-entraîné appelé VGG-16 à cet effet. Vous pouvez charger ce modèle en Python avec la bibliothèque Keras.
VGG-16 est une architecture Convolution Neural Net (CNN) formée sur ImageNet, qui contient plus de 14 millions d’images. Il se compose d’images d’objets du quotidien, de fruits, de véhicules et de certaines espèces d’animaux.
Après avoir chargé le modèle VGG-16 dans Python, vous pouvez vous entraîner dessus avec les images étiquetées dans l’ensemble de données Kaggle pour classer les dix types d’animaux différents.
Ensemble de données : Ensemble de données Animals-10 Kaggle
De nombreuses maladies telles que le cancer, les tumeurs et la pneumonie sont détectées à l’aide d’un diagnostic assisté par ordinateur à l’aide de modèles d’IA.
Des ensembles de données d’images ouvertes sont disponibles sur Kaggle pour la détection des maladies. Vous pouvez vous essayer à la prédiction des maladies sur l’un de ces ensembles de données…… l’ensemble de données d’images de radiographie thoracique (détection de la pneumonie) sur Kaggle.
Cet ensemble de données se compose de trois types d’images radiographiques pulmonaires étiquetées : pneumonie normale, bactérienne et pneumonie virale. Vous pouvez créer un modèle qui classe l’état de santé d’un patient dans l’une de ces trois catégories sur la base d’une image radiographique de ses poumons.
Pour créer ce modèle, vous pouvez utiliser une bibliothèque Python appelée FastAI. FastAI est une bibliothèque open source qui permet aux utilisateurs de créer et de former rapidement des modèles d’apprentissage en profondeur pour divers problèmes, notamment la vision par ordinateur et la PNL.
Cette bibliothèque offre un niveau d’abstraction plus élevé que Keras et est très facile à utiliser si vous êtes débutant. Un problème qui prend plus de 30 lignes à résoudre avec Keras peut être résolu en seulement cinq lignes de code avec FastAI.
Vous pouvez télécharger le modèle pré-entraîné ResNet50 depuis FastAI et vous entraîner sur ce modèle pour créer le classificateur. ResNet50 nous permet de former des réseaux de neurones incroyablement profonds avec plus de 150 couches, et la formation par-dessus vous donnera de bons résultats.
Ensemble de données : images de radiographie thoracique de Kaggle
Obtenez un accès GRATUIT à des exemples de codes d’apprentissage automatique pour le nettoyage des données, le traitement des données et la visualisation des données
Si vous êtes un passionné d’IA, vous avez probablement entendu parler de Teachable Machine de Google. Teachable Machine est un outil Web créé pour rendre l’apprentissage automatique accessible à tous.
Si vous visitez le site Teachable Machine de Google, ils vous permettent de télécharger des photos de différentes classes, puis de former un modèle d’apprentissage automatique côté client sur ces images.
Un exemple du fonctionnement de Teachable Machine :
Il existe deux classes d’images que vous devez télécharger. Tout d’abord, vous téléchargez environ 100 photos de vous-même et les étiquetez comme classe 1. Ensuite, vous téléchargez 100 autres photos de votre chat et les étiquetez comme classe 2.
Ensuite, vous cliquez sur le bouton « Former le modèle » et un modèle d’apprentissage automatique côté client apprendra à faire la distinction entre les photos de vous et de votre chat.
Vous pouvez ensuite utiliser ce modèle pour faire de nouvelles prédictions sur les images.
Google a publié Teachable Machine il y a quelque temps, afin que les personnes qui ne connaissent pas bien l’IA puissent visiter le site et former leurs modèles. Il permet aux personnes non techniques de se familiariser avec l’apprentissage automatique.
Vous pouvez créer votre version de Teachable Machine de Google.
Les étapes à suivre sont les suivantes :
La correction automatique est une application d’IA que nous utilisons quotidiennement. Cela nous facilite la vie en prenant soin des fautes d’orthographe et des erreurs grammaticales.
Pour créer un outil de correction automatique en Python, vous pouvez utiliser la bibliothèque TextBlob en Python. Cette bibliothèque a une fonction appelée « correct() ». Si vous appelez cette fonction sur un morceau de texte, elle identifiera les mots incorrects et les remplacera par le mot le plus proche de celui tapé.
C’est une tâche relativement simple, mais il est essentiel de garder à l’esprit que la bibliothèque TextBlob n’est pas parfaite. L’algorithme sous-jacent ne peut pas détecter certains mots mal orthographiés et effectue des corrections lorsque le mot initial était correct, comme remplacer « est » par « comme ».
Cet outil n’est pas capable de saisir le contexte entre ces deux mots et n’effectue aucun type de cartographie pour identifier les mots couramment utilisés ensemble. Par exemple, si je devais écrire « J’aime ton short » au lieu de « J’aime ta chemise », l’algorithme ne me corrigerait pas. Ces mots sont correctement orthographiés mais ne correspondent pas au contexte de la phrase.
Vous pouvez améliorer les limites de ce modèle en créant le vôtre… — vous pouvez utiliser un modèle PNL pré-entraîné comme BERT qui a été formé pour prédire les mots qui s’inscrivent dans un contexte spécifique.
Ce projet d’IA est similaire au projet de détection de spam Instagram répertorié ci-dessus. De nombreux propriétaires d’entreprise fabriquent des critiques sur leurs produits afin d’obtenir davantage de ventes, trompant les personnes qui cherchent à acheter des produits de haute qualité.
Vous pouvez créer un faux système d’identification des avis pour résoudre ce problème. Kaggle dispose d’un ensemble de données appelé Deceptive Opinion Spam Corpus que vous pouvez utiliser pour ce projet. Cet ensemble de données contient 1 600 avis sur des hôtels : 800 d’entre eux sont positifs et 800 autres sont négatifs.
Ces avis sont déjà étiquetés, il vous suffit donc d’effectuer un prétraitement des données et une tokenisation sur toutes ces données avant d’entraîner votre modèle. Vous pouvez utiliser l’apprentissage par transfert à cette fin avec des modèles pré-entraînés comme BERT, RoBERTa et XLNet.
Lecture recommandée:
Les projets de cette section de projets d’IA avancés ne sont pas délicats, mais ils nécessitent que vous ayez des connaissances plus avancées en matière de compétences en IA pour créer et déployer des projets d’IA de bout en bout. Ces projets conviennent mieux aux professionnels de l’IA.
Avez-vous déjà vu une robe dans un magasin et vous vouliez connaître le prix le plus bas possible ?
Dans ce projet d’IA, vous pouvez créer une application qui permet aux utilisateurs de télécharger une photo de l’article qu’ils souhaitent acheter. Ensuite, l’application parcourra de nombreuses boutiques en ligne et trouvera le prix le plus bas pour l’article. De cette façon, l’utilisateur obtient la meilleure offre possible.
Pour créer une application comme celle-ci, vous devrez d’abord créer un algorithme capable d’identifier les objets dans une image. Par exemple, si l’utilisateur télécharge une photo d’une robe à fleurs rose, l’algorithme doit identifier correctement la couleur et le style de la robe.
Vous pouvez utiliser l’apprentissage par transfert pour ce projet d’IA et vous entraîner sur des modèles comme VGG-16 avec une base de données préexistante de descriptions d’éléments. Une fois le modèle construit, vous pouvez donner à l’utilisateur le choix de spécifier des informations supplémentaires sur l’article… – marque, point de vente, etc.
Après avoir collecté toutes ces informations, vous devez créer un algorithme qui identifie les boutiques en ligne sur la base des informations de marque fournies. Créez un outil automatisé qui ouvre ces sites et récupère les informations sur les prix d’au moins 3 à 4 magasins en ligne.
Ensuite, renvoyez le nom du site et les informations sur les prix à l’utilisateur, ainsi qu’un lien vers l’endroit où il peut acheter l’article. La seule partie de ce projet qui intègre des idées d’IA est la description de l’article basée sur l’image téléchargée par l’utilisateur. Tout le reste nécessite que vous ayez des compétences en déploiement de modèles , la capacité de restituer rapidement des informations à l’utilisateur et une solide maîtrise des langages de programmation de la science des données .
Ensemble de données : ensemble de données sur la mode Kaggle
Débloquez GRATUITEMENT l’expérience d’apprentissage ProjectPro
La répartition des races est un élément essentiel de la segmentation de la clientèle dans les entreprises. Cependant, il n’est pas toujours facile d’accéder à ces données car elles ne sont pas accessibles au public.
Vous pouvez créer un modèle de détection de l’appartenance ethnique qui détecte l’origine ethnique d’une personne à partir de sa photo.
OpenCV ne dispose pas encore de package capable de détecter la race, mais vous pouvez créer votre propre CNN ou utiliser l’apprentissage par transfert pour créer ce modèle.
Vous pouvez utiliser l’ensemble de données UTKFace pour l’entraînement. Les modèles de détection de l’origine ethnique développés à l’aide de cet ensemble de données ont pu atteindre une précision de près de 0,80.
Ensemble de données : ensemble de données Kaggle UTKFace
GitHub : Détection d’origine ethnique en Python
Avez-vous déjà été coincé dans un embouteillage soudain pendant plus d’une heure ? Si vous saviez qu’il y aurait un trafic intense, vous auriez emprunté un autre itinéraire pour gagner du temps.
Vous pouvez créer un modèle de prévision des embouteillages à l’aide de techniques d’apprentissage profond en Python. Vous pouvez utiliser à cette fin des ensembles de données Waze librement disponibles. Vous pouvez obtenir des données sur différents types d’événements de circulation, ainsi que leur date, heure et emplacement exact. Vous pouvez ensuite créer un modèle qui prédit le lieu et l’heure du prochain embouteillage.
Il existe de nombreux modèles et documents de recherche existants sur la mise en œuvre des idées d’IA que vous pouvez lire, et de nombreuses méthodologies différentes ont réussi à produire des résultats élevés.
L’une des approches qui a réussi à remporter un hackathon a été l’utilisation des RNN pour prédire les embouteillages importants. Les données Waze ont été utilisées pour identifier les événements à fort trafic. Ensuite, une séquence d’événements menant à l’embouteillage a été enregistrée avec leurs horodatages pour former un RNN.
Le modèle a été construit uniquement en Python avec la bibliothèque Keras et a fourni des résultats très précis.
Ensemble de données : ensemble de données ouvert Waze
Lorsque nous regardons le visage d’une personne, nous pouvons généralement discerner à quelle tranche d’âge elle appartient. Nous pouvons savoir si une personne est jeune, d’âge moyen ou âgée. Dans ce projet d’IA, vous pouvez automatiser ce processus en créant un modèle de détection de l’âge par apprentissage profond. Les entreprises utilisent souvent des données démographiques pour mieux commercialiser leurs produits et définir leur public cible. Cependant, ces données ne sont pas toujours faciles à obtenir.
Premièrement, les utilisateurs de plateformes de médias sociaux comme Facebook mentent souvent sur leur âge. Ces informations sont également souvent cachées et ne sont pas rendues publiques. En créant un modèle de détection de l’âge, vous pouvez facilement prédire l’âge d’une personne à l’aide de sa photo de profil et vous n’avez pas besoin de perdre du temps à essayer de récupérer des données qui ne sont pas rendues publiques.
Vous pouvez le faire facilement avec une bibliothèque appelée OpenCV. OpenCV est une bibliothèque open source utilisée pour le traitement d’images et la vision par ordinateur. Vous pouvez l’utiliser pour traiter rapidement les données d’image afin d’identifier des visages, des objets et même l’écriture manuscrite. Vous pouvez installer la bibliothèque OpenCV et y accéder facilement avec Python. OpenCV dispose d’un package appelé DNN (Deep Neural Networks) qui peut être utilisé pour importer des modèles à partir de frameworks d’apprentissage profond bien connus. Vous pouvez utiliser un framework appelé Caffe pour cette tâche, qui dispose de modèles pré-entraînés pour l’âge et le sexe.
Dans ce projet d’intelligence artificielle de niveau avancé, vous pouvez créer une application Web qui convertit une image téléchargée par un utilisateur en un croquis au crayon.
Pour ce faire, vous pouvez suivre les étapes suivantes :
Il s’agit d’un projet d’IA relativement simple puisque des bibliothèques sont disponibles pour gérer la conversion d’image pour vous. Cependant, la partie la plus difficile consiste à créer une application fonctionnelle avec laquelle les utilisateurs peuvent interagir, car elle nécessite la connaissance de langages autres que Python.
Vous pouvez créer une application Web de reconnaissance gestuelle en Python. Pour ce faire, vous pouvez utiliser la base de données de reconnaissance des gestes de la main sur Kaggle. Cet ensemble de données se compose de 20 000 gestes étiquetés.
Vous pouvez entraîner cet ensemble de données sur VGG-16. Vous pouvez également utiliser OpenCV pour collecter un flux de données vidéo en direct et utiliser le modèle pour détecter et faire des prédictions sur les gestes de la main en temps réel.
Vous pouvez même créer une application de reconnaissance des gestes de la main. Déployez votre modèle sur un serveur et laissez-le faire des prédictions à mesure que les utilisateurs effectuent divers gestes de la main.
Ensemble de données : Reconnaissance des gestes de la main Kaggle
Dans ce projet, vous pouvez créer un modèle d’apprentissage en profondeur capable de compléter automatiquement une phrase. Le modèle prédira la fin d’une phrase en fonction des premiers mots comme invite d’écriture.
Vous pouvez utiliser ce modèle pour écrire des histoires ou compléter des messages texte amusants.
Pour créer un modèle de génération de texte, vous pouvez utiliser le modèle GPT-2 d’OpenAI. GPT-2 est une intelligence artificielle open source à laquelle les utilisateurs peuvent accéder pour diverses tâches de PNL.
Vous pouvez accéder à GPT-2 en Python en clonant leur référentiel GitHub, auquel nous ferons un lien ci-dessous. Une fois que vous avez cloné le référentiel, vous pouvez simplement exécuter les fichiers Python et fournir une chaîne de texte d’entrée. Indiquez également le nombre de mots que vous souhaitez que GPT-2 génère en fonction du texte saisi et GPT-2 proposera un article entier avec le nombre de mots que vous avez mentionné.
Une grande partie du texte généré par GPT-2 n’a pas de sens, mais vous pouvez l’utiliser pour recréer vos histoires préférées ou même écrire un article. Il s’agit en grande partie de déchets littéraires, mais c’est amusant !
Encore une fois, vous pouvez transformer cela en une application très rapidement avec seulement quelques lignes de code. Laissez l’utilisateur saisir un mot à l’invite et afficher un article rédigé par GPT-2.
GitHub : GPT-2
Explorez davantage de projets de science des données et d’apprentissage automatique pour la pratique. Accélérez votre transition de carrière avec ProjectPro
Dans ce projet d’intelligence artificielle, vous construirez un modèle capable de détecter la couleur d’une image.
Vous pouvez utiliser l’ensemble de données de reconnaissance des couleurs sur Kaggle. Pour créer ce projet, vous devrez convertir chaque image de l’ensemble de données en canaux RVB. Ensuite, vous pouvez calculer la distance entre la couleur de l’image d’entrée et les trois canaux de couleur différents avec une formule comme celle-ci :
d = abs(Red — ithRedColor) + (Green — ithGreenColor) + (Bleu — ithBlueColor)
Pour améliorer encore ce projet d’IA, vous pouvez créer une application qui affiche plusieurs couleurs à l’écran. Une fois que l’utilisateur final clique sur une couleur, l’algorithme calcule automatiquement la distance et crée une prédiction, l’affichant à l’écran.
En utilisant OpenCV en Python , vous pouvez afficher ce texte exactement à l’endroit où l’utilisateur a cliqué sur l’écran et dessiner un rectangle ou un cadre de délimitation autour de lui.
Ensemble de données : ensemble de données de reconnaissance des couleurs Kaggle
Parfois, il peut être difficile de communiquer avec des personnes malentendantes. Apprendre la langue des signes peut être compliqué, et ce n’est pas une compétence que la plupart d’entre nous possèdent.
Dans ce projet, vous pouvez créer une application de reconnaissance de la langue des signes en Python. Pour ce faire, vous devez suivre les étapes suivantes :
Une fois que vous avez fini de créer le modèle, vous pouvez choisir de le déployer. Construire une application qui permet aux personnes malentendantes de converser avec des personnes qui ne connaissent pas l’ASL est extrêmement utile. Il sert de moyen de communication à deux personnes qui, autrement, n’auraient pas de conversation.
Ensemble de données : ensemble de données sur la langue des signes américaine au niveau mondial
Les vidéos affichant de la violence ou du contenu sensible sont nuisibles et peuvent avoir un impact négatif sur la santé mentale d’une personne. Les vidéos comme celle-ci sur les réseaux sociaux doivent être marquées d’un avertissement déclencheur ou censurées pour les personnes qui n’aiment pas regarder du contenu violent.
Dans ce projet, vous pouvez créer un modèle d’apprentissage en profondeur qui détecte la violence dans les vidéos et génère automatiquement un avertissement, informant les utilisateurs de les regarder à leurs propres risques.
Pour entraîner ce modèle, vous pouvez utiliser des ensembles de données contenant à la fois du contenu violent et non violent (ceux-ci seront liés ci-dessous). Vous pouvez extraire des images de ces vidéos et former un CNN sur celles-ci. Il existe différents modèles pré-entraînés que vous pouvez utiliser pour accomplir cette tâche, notamment VGG16, VGG19 et Resnet50.
Les gens ont réussi à obtenir des scores de précision élevés (plus de 90 %) pour cette tâche grâce à l’apprentissage par transfert. Étant donné que l’apprentissage par transfert utilise des modèles qui ont déjà été formés sur des millions d’images générales, ces modèles fonctionnent généralement mieux que les modèles que vous entraînez à partir de zéro.
Ensembles de données : Ensemble de données sur les flux violents / Ensemble de données sur les vidéos de combat de hockey
Accédez à des exemples de code de projet de science des données et d’apprentissage automatique
Voici quelques derniers projets d’IA intéressants qui méritent d’être explorés :
Vous créerez un modèle d’apprentissage automatique pour prendre en charge le diagnostic des maladies dans ce projet. Vous utiliserez des tonnes d’images acquises dans des régions rurales pour faciliter la détection automatique de la rétinopathie diabétique. Le modèle aidera à prévenir la cécité et à détecter d’autres maladies futures, telles que le glaucome et la dégénérescence maculaire. Utilisez deux modèles pré-entraînés pour ce projet : Resnet101 et Resnet152. Utilisez l’ensemble de données APTOS 2019 Blindness Detection pour créer le modèle de classificateur d’images. L’ensemble de données comprend le fichier train.csv, qui contient 3 662 images rétiniennes.
Nous portons tous des masques depuis près de deux ans en raison de l’épidémie de Covid-19. De nombreux lieux publics, notamment les centres commerciaux, les théâtres et les restaurants, refusent d’admettre toute personne ne portant pas de masque.
Système de reconnaissance faciale
L’objectif de la recherche est de créer un modèle d’apprentissage profond personnalisé pour identifier si une personne porte ou non un masque. Pour créer le modèle de détection de masque facial, utilisez l’ensemble de données de masque facial disponible sur Github. Il y a 1 376 photos dans cette collection, réparties en deux catégories : avec masques et sans masques. Dans ce projet, vous apprendrez à utiliser Keras et TensorFlow pour former un classificateur capable de détecter automatiquement si quelqu’un porte ou non un masque. Vous pouvez affiner l’architecture MobileNet V2 à l’aide de poids ImageNet pré-entraînés.
Le projet sur l’intelligence artificielle vise à former un Deep Network pour imiter le comportement de conduite humain lors de la conduite dans un simulateur d’Udacity, lui permettant ainsi de se déplacer de manière indépendante. Le réseau utilise le cadre de la caméra frontale (par exemple, une caméra montée sur le toit) comme entrée et prédit la direction de direction à chaque instant. Pour ce projet, vous pouvez collecter les données avec le simulateur Udacity lui-même ou utiliser la formation « prêt à l’emploi » proposée par Udacity.
En ajustant de manière appropriée l’angle de braquage de la vérité terrain, utilisez les images des caméras latérales pour augmenter l’ensemble de formation. Ajoutez des couches d’abandon après chaque couche convolutive et chaque couche entièrement connectée jusqu’à la dernière pour éviter le surajustement.
Si vous possédez les compétences et les connaissances, vous pouvez mettre en pratique ces projets et les utiliser comme références pour construire de nouveaux projets. Voici quelques projets Google AI nouveaux et à venir que vous devez explorer.
Il s’agit de l’un des projets d’IA de Google les plus uniques et les plus fascinants . Dans ce projet, le rendu parallèle permet de créer des visuels ultra-lumineux qui peuvent pénétrer à travers les surfaces nues. Ce projet vise à utiliser des graphiques rectilignes sur des écrans OLED à matrice passive produits en série à faible coût pour révéler des interfaces graphiques cachées.
Ce projet sur l’intelligence artificielle implique l’implantation d’une technologie d’interface sous différentes surfaces/matériaux, et l’utilisation d’une telle technologie entraîne des niveaux de luminosité plus élevés et des affichages à faible coût sous des surfaces comme le bois, les textiles, etc. En outre, le projet explore les avantages de l’utilisation de systèmes passifs. les OLED matricielles (PMOLED), dont l’architecture de base minimise le coût et la complexité.
Lien source – Interfaces cachées pour l’informatique ambiante
Ce projet d’IA montre comment Google exploite l’apprentissage automatique pour aider les gastro-entérologues (GI) dans la lutte contre le cancer colorectal en améliorant l’efficacité des coloscopies.
Détection du cancer du sein par régression logistique
Le projet vise à créer un modèle d’apprentissage automatique qui aidera le GI à détecter les polypes dans la zone observée, surmontant ainsi le problème de la détection incomplète. Le modèle CNN développé repose sur une architecture qui intègre une logique temporelle avec un détecteur de trame unique pour obtenir des résultats plus précis. Ce projet implique de travailler sur deux architectures de réseaux neuronaux différentes : RetinaNet et LSTM-SSD.
Lien source – Détection de polypes insaisissables à l’aide d’un système d’IA à grande échelle
Les modèles complexes tels que les tableaux, les colonnes, etc., dans les documents de formulaire, limitent l’efficacité des méthodes de sérialisation rigides.
Ce prochain projet Google AI présente FormNet, un modèle de séquence axé sur la structure des documents. Le modèle permet de minimiser la sérialisation inadéquate des documents de formulaire. Pour ce projet, vous développerez un mécanisme Rich Attention (RichAtt) qui utilise un lien spatial 2D entre les jetons de mots pour calculer des poids d’attention plus précis. Ensuite, pour chaque mot, créez des super-jetons en utilisant un réseau convolutif graphique (GCN) pour intégrer les représentations des jetons voisins. Enfin, montrez que FormNet surpasse les approches conventionnelles tout en utilisant un minimum de données de pré-formation et offre des performances de pointe sur les benchmarks CORD, FUNSD et Payment.
Lien source – Extraction de documents à l’aide de FormNet
Découvrez ces projets AI Python pour les étudiants si vous êtes un nouveau venu à la recherche d’idées d’IA passionnantes pour élargir vos connaissances et vos compétences.
Un bot est un programme informatique que vous pouvez programmer pour réaliser des activités spécifiques. Les robots imitent ou reproduisent généralement complètement le comportement humain.
Créer un robot Telegram
L’un des projets d’IA Python les plus passionnants consiste à utiliser l’API Telegram pour créer un bot Telegram avec Python. Vous devez d’abord obtenir une API de bot Telegram à partir du compte BotFather Telegram. BotFather est un robot simple qui fournit une API unique pour aider à créer d’autres robots. Une fois que vous disposez de la clé API pour créer votre bot Telegram, l’étape suivante consiste à installer le package Telegram. Créer un programme « Hello World » est la méthode la plus simple pour que votre bot soit opérationnel. Il vous suffit simplement de programmer votre chatbot avec une commande à laquelle votre bot télégramme répondra par le message « Hello, World ».
Google Trends est un outil de recherche de mots clés populaire qui aide les chercheurs, les blogueurs, les spécialistes du marketing numérique, etc. à déterminer la fréquence à laquelle les gens recherchent un mot clé dans le moteur de recherche Google au cours d’une période spécifique. Google Trends est utile pour la recherche de mots clés, en particulier lors de la création d’articles traitant de sujets d’actualité.
Ce projet vous montrera comment utiliser Python pour effectuer une recherche de mots-clés afin de déterminer les sujets et les mots-clés les plus populaires. La première étape consiste à accéder aux tendances Google à l’aide de l’API Google et du package pytrends en Python. Vous pouvez installer rapidement pytrends à l’aide de la commande pip – pip install pytrends . Vous devez d’abord vous connecter à Google puisque nous utilisons Google Trends pour trouver des sujets populaires. Pour ce faire, importez la méthode TrendReq depuis la méthode pytrends.request. Vous pouvez également obtenir les tendances de recherche quotidiennes dans le monde entier à l’aide de la méthode Trending Search().
Ce projet sur l’intelligence artificielle vise à prévoir le résultat d’une valeur constante, comme un prix ou une probabilité. Créez un modèle qui prédit l’efficacité énergétique des véhicules à l’aide de l’ensemble de données Auto MPG, l’un des ensembles de données les plus connus parmi les praticiens de l’apprentissage automatique. Vous devez donner les descriptions des modèles (y compris le nombre de cylindres, la cylindrée, la puissance, le poids, etc.) de divers véhicules d’une période spécifique. À l’aide du package Python pandas, importez les données. Créez deux ensembles de données : un pour la formation et un pour les tests. Utilisez la méthode pairplot() de la bibliothèque Seaborn pour visualiser les données. Créez votre modèle de prédiction à l’aide de l’API séquentielle avec deux couches cachées et une couche de sortie qui renverra une valeur unique.
L’un des défis majeurs non résolus des études environnementales est la prévision des tremblements de terre. Ce projet vous montrera comment utiliser l’apprentissage automatique et le langage de programmation Python pour développer un modèle de prévision des tremblements de terre.
Avant de charger et de lire l’ensemble de données (utilisez l’ensemble de données disponible sur Github), importez les bibliothèques Python essentielles, telles que pandas, NumPy et matplotlib . Explorez les principales caractéristiques des données sismiques et concevez un objet pour ces caractéristiques, telles que la date, l’heure, la latitude, la longitude, la profondeur et la magnitude. Avant de développer le modèle de prédiction, visualisez les données sur une carte du monde pour afficher un aperçu complet des endroits où la fréquence des tremblements de terre sera la plus élevée. Divisez les données en un ensemble de formation et un ensemble de test pour validation. Enfin, créez un réseau neuronal pour adapter les données de l’ensemble de formation.
La prévision du prix des voitures est l’un des projets d’IA Python les plus élémentaires pour les étudiants de dernière année . Ce projet vous montrera comment utiliser PyTorch pour former un modèle qui vous aidera à prédire les prix des automobiles à l’aide du Machine Learning. Pour ce projet, utilisez un ensemble de données qui inclut les coûts des différentes voitures et la variable que vous prédisez, c’est-à-dire le prix de vente des véhicules.
Importez toutes les bibliothèques essentielles, telles que pandas, matplotlib et autres, puis chargez l’ensemble de données. Pour utiliser les données pour la formation, vous devez les transformer d’une trame de données en Tensors PyTorch, ce qui nécessite de les convertir en tableaux NumPy. Convertissez ces tableaux en tenseurs PyTorch, puis utilisez-les pour créer un ensemble de données variables.
Découvrez ces projets d’intelligence artificielle fascinants avec le code source disponible sur Github pour vous aider à comprendre les applications de l’IA dans différents domaines.
Ce projet en IA utilise un système de recommandation basé sur la similarité d’images pour aider les gens à choisir leur logement Airbnb préféré. Utilisez l’ensemble de données InsideAirbnb d’Airbnb, qui contient une liste complète d’appartements aux États-Unis. Vous pouvez utiliser la bibliothèque urllib2 pour récupérer des photos et d’autres informations sur les appartements Airbnb à Boston.
Commencez par rassembler des détails de base sur les appartements Airbnb auprès d’InsideAirbnb (emplacement, descriptions, fourchette de prix et URL de la page d’accueil) et enregistrez-les dans MongoDB exécuté sur une instance EC2. Enregistrez les photos de l’appartement sur S3 après les avoir récupérées sur Airbnb. En attendant, supprimez les balises de surbrillance et les avis des utilisateurs et enregistrez-les pour référence future. Extrayez une fonctionnalité d’histogramme HSV pour chaque image en décomposant d’abord l’image en canaux H/S/V, puis en créant des histogrammes pour chaque canal et en combinant les trois histogrammes. Pour valider les caractéristiques des photos, utilisez le score métrique de Calinski-Harabasz et la distance cosinus pour calculer les similitudes dans les images.
Ce projet d’intelligence artificielle vise à créer une solution efficace d’irrigation et de détection des ravageurs qui vous permet de prendre des décisions éclairées et d’améliorer la qualité du rendement. La première étape du projet consiste à installer tout dispositif programmable (tel qu’une électrovanne) au début du canal/ruisseau. Chacun des plus petits appareils sur le terrain disposera d’un capteur de température et d’humidité, qui vous fournira des données de capteur en temps réel. Créez un réseau MQTT pour relier chaque client au serveur local.
La deuxième étape de ce projet consiste à créer un modèle CNN pour prédire la croissance d’un ravageur spécifique pour une culture particulière à l’aide des données de température et d’humidité en temps réel. Calculez une estimation de base des valeurs NDVI des années précédentes pour la comparer à l’indice de végétation terrestre actuel des agriculteurs et affichez-la sur votre portail.
Lien source – Prédiction et détection des ravageurs
Dans ce projet d’IA, vous créerez une application d’IA capable de détecter les maladies des plantes en mettant en œuvre un modèle d’apprentissage en profondeur. Vous utiliserez le framework Pytorch et une architecture de réseau neuronal convolutif (CNN) pour mettre en œuvre le modèle d’apprentissage en profondeur.
Classificateur d’images pour l’identification des espèces végétales
Entraînez le classificateur d’images à distinguer les différentes maladies des plantes en regardant une image. Vous pouvez utiliser ce classificateur pour créer une application téléphonique qui vous indique le type de maladie examinée par votre caméra. Ce projet utilise l’ensemble de données « Plant Village » qui comprend 38 classes de maladies des plantes et une classe d’arrière-plan provenant de l’ensemble de données ouvert d’images d’arrière-plan de Standford.
Les idées de projets d’intelligence artificielle décrites ci-dessus ne constituent en aucun cas une liste exhaustive. L’IA est un domaine incroyablement vaste, et avec un peu de créativité et de savoir-faire technique, vous pourrez créer de fantastiques projets logiciels d’intelligence artificielle à présenter dans votre portfolio. Avec la démocratisation de l’IA, il est devenu de plus en plus facile pour un ingénieur en apprentissage automatique de créer des modèles d’IA pour résoudre des problèmes commerciaux dans divers domaines commerciaux. Des bibliothèques de haut niveau comme FastAI et des modèles open source pré-entraînés ont rendu l’IA accessible à tous. Tant que vous avez une compréhension intermédiaire de l’apprentissage automatique et de la programmation, vous pouvez créer des modèles adaptés à divers cas d’utilisation. Explorez des projets d’intelligence artificielle et d’apprentissage automatique résolus de bout en bout pour apprendre l’IA et commencez à appliquer vos compétences en IA dans la pratique en travaillant sur des projets pratiques simples d’intelligence artificielle pour faire le premier pas vers une carrière dans l’IA.
Certaines des raisons à l’origine de l’échec des projets d’IA-
Il n’existe pas de « meilleur » langage de programmation pour les projets d’intelligence artificielle (IA), car différents langages ont leurs propres forces et faiblesses. Les choix populaires incluent Python, R et C++, chacun avec son propre ensemble de bibliothèques, de frameworks et d’outils pour créer des applications d’IA. Le choix de la langue dépend en fin de compte des exigences spécifiques du projet, de l’expertise de l’équipe et d’autres facteurs.
Les défis qui peuvent survenir lors d’un projet d’intelligence artificielle incluent la qualité des données, le manque d’expertise dans le domaine, la sélection des algorithmes et l’interprétabilité. Ces défis peuvent être surmontés grâce à une collecte et un prétraitement minutieux des données, à une collaboration avec des experts du domaine, à l’expérimentation de différents algorithmes et au développement de méthodes permettant d’expliquer les résultats des modèles d’IA. De plus, l’intégration de considérations éthiques tout au long du projet peut contribuer à garantir un développement responsable de l’IA.