L’IA n’existe pas

J’avais écrit l’année dernière un article, qui s’appelait « Machine vs Human : Artificielle oui, Intelligence non ». https://www.workit-software.com/fr/2018/06/01/machine-vs-human-artificielle-oui-intelligence-non/.

Aujourd’hui, je viens de finir le dernier livre de Luc Julia qui s’intitule, L’intelligence Artificielle n’existe pas. Tout un programme pour ce chercheur français qui a travaillé chez Apple à la création de SIRI, qui a développé le cloud pour l’IoT chez SAMSUNG, et qui est en train de monter un centre de recherche en IA en France toujours pour SAMSUNG. Bref, une pointure mondiale de l’intelligence artificielle, enfin de l’intelligence « augmentée » car vous avez compris l’intelligence artificielle n’existe pas. La machine a accès à une masse de données gigantesque et a une capacité de calcul phénoménale, mais elle ne réfléchit pas, ne peut pas sortir de son contexte, n’a pas conscience de ce qu’elle fait, n’innove pas. Et il pense comme Yann Lecun (le patron du Facebook Lab, encore un français d’ailleurs) et d’autres scientifiques, que l’intelligence artificielle à l’image humaine ne va pas exister dans un futur proche, voire moins proche. Tant pis pour les trans-humanistes et autres californiens exaltés.

Je ne vais vous résumer le livre ici mais je vous encourage à le lire car il est très facile d’accès, et remet les pendules à l’heure. Mais je vais vous citer 2 exemples tirés de ce livre, qui remettent les choses en perspective. En premier, dans le cadre de la reconnaissance d’image, il faut donner environ 100000 images de chat à une machine pour qu’elle reconnaisse par la suite un chat dans 95% des cas. Pour un enfant, vous lui donnez 2 images de chat, et il sera capable de reconnaître un chat dans quasiment 100% des cas pour le restant de sa vie. L’autre exemple est encore plus intéressant : Luc Julia prend l’angle de la performance énergétique des machines par rapport aux hommes. Quand Alpha GO, la machine de Google à base de deep learning, a certes battu pour la première fois un humain au jeu de GO, elle a consommé 440000 Watts/heure quand le cerveau humain n’a consommé que 20W/h. Alors c’est qui le plus intelligent ?

Luc Julia termine donc son livre en nous expliquant que le développement de l’Intelligence Artificielle avec le big data, du Machine learning, du deep learning, va nous conduire à une surconsommation d’énergie et à un véritable problème écologique. Il en conclut qu’il faudra donc se tourner vers le « small data » plutôt que le big data. Un peu comme les humains quoi.

Quelle conclusion en tirer pour WORKIT et l’entrepreneur que je suis dans le « smart data pour le e-commerce » ? Il faut bien sûr regarder ce qu’il se fait dans le domaine du machine learning, mais en investissant également dans le capital humain de nos centres offshores ; comment augmenter l’intelligence de nos équipes à Madagascar, en Inde ou au Mexique avec les capacités des machines ?

Machine vs Human : Artificielle ? Oui, Intelligence ? Non

Machine vs Human : Artificielle ? Oui, Intelligence ? Non

Le machine learning arrive dans toutes les entreprises aujourd’hui, et nous donne l’impression que l’humain va être remplacé par des Intelligences Artificielles présentes un peu partout. En fait oui et non, mais plutôt non. Certes, la robotisation aidée de l’intelligence artificielle, va continuer à détruire des emplois, mais ça, ça n’est pas nouveau. Ainsi Amazon aurait aujourd’hui 75000 robots dans ses entrepôts pour optimiser toujours plus sa logistique. C’est toujours moins cher et plus efficace de mettre des robots que des humains, pour porter des colis dans un entrepôt. Disons que c’est plutôt la robotisation que l’IA qui remplace les humains.

En revanche, l’intelligence artificielle nous aide dans l’analyse de grands volumes de données ( big data si vous préférez, ça fait plus techno) grâce au Machine Learning. Mais comment ça marche exactement ? Dans machine learning, il y a « learning », et qui va faire le learning des machines ?… et bien des humains. Et oui, il faut préparer des données d’apprentissage (data sets) que l’on va ensuite donner à la machine, pour qu’elle apprenne et qu’elle puisse ensuite extrapoler sur des volumes de données plus grands, et plus il y a de cas d’analyse, plus il y a de data sets à créer, et donc d’humains pour les créer. Mais ça, on en parle pas trop tôt, car ça ne fait pas vraiment « technologique ». Ca fait plus artificiel que intelligent. En fait le machine learning, c’est ce qu’on appelle de l’IA faible. Plutôt que dire, que ça n’est pas intelligent, on dit que c’est intelligent mais faiblement .Vous imaginez si on dit à quelqu’un qu’il est faiblement intelligent ? En fait, c’est qu’il est vraiment con. C’est pareil pour les ordinateurs.

Alors, est-ce que ça va remplacer des humains ?

Non, car vous l’avez compris, il faudra toujours des humains pour créer les données d’apprentissage (datas sets), et les donner à apprendre aux machines. Donc, ça multiplie nos capacités d’analyse mais ça ne détruit pas d’emplois pour l’instant, et ça peut même en créer. Comme toute révolution industrielle, ça les transforme.

Article rédigé par Bernard EUVERTE, CEO fondateur chez WorkIT Software

FASHION: WORKIT @ TRAFFIC

FASHION: WORKIT @ TRAFFIC

Les 4 et 5 avril, WorkIT a visité le salon TraFFic. C’est la deuxième année que le salon est organisé au Carreau du Temple à Paris. TraFFic permet de réunir des marques / designers, et des entreprises travaillant dans des domaines tels que le marketing, la technologie et les ressources humaines. Son premier objectif est d’aider les marques à découvrir des technologies et à entrer en contact avec des entreprises capables de les aider à croître et à évoluer. Son deuxième objectif est de faciliter un échange entre les différents acteurs, afin de faciliter les opportunités d’affaires. Enfin, son troisième objectif est de promouvoir l’innovation technologique dans la mode.

Nous avons visité le salon afin de mieux comprendre ce qui est nouveau et innovant sur la scène FashionTech. Sans surprise, l’intelligence artificielle a fait l’objet d’une attention particulière, de nombreuses entreprises proposant des solutions capitalisant sur ces technologies. Nous avons été agréablement surpris de voir à quel point le secteur est en train de se transformer grâce à des algorithmes de Machine Learning, capables d’analyser des millions d’images et de descriptions de mode, pour trouver des produits similaires, prédire des tendances ou offrir une expérience de d’achat en ligne plus personnalisée. Ceci est en phase avec notre travail chez WorkIT, où nous utilisons des algorithmes d’apprentissage automatique, à la pointe de la technologie, pour transformer et faire progresser l’intelligence des prix pour les produits de mode. Une chose est sûre: l’IA est là pour rester, et son impact sur le secteur du commerce de détail ne fera que continuer à croître et à évoluer.

Machine Learning

Machine Learning

Depuis ses débuts, le marché de l’e-commerce connaît une croissance ininterrompue. Faire de la veille concurrentielle devient donc une tâche de plus en plus complexe, car :

  • Le volume des produits à surveiller est beaucoup plus important.
  • Le taux de rotation des stocks et les changements d’assortiments exposent une quantité de produits à traiter dans des temps de plus en plus limités.
  • La variété des produits, allant de télévision et lave linge, jusqu’aux fruits et légumes, en passant par les produits de la mode, ne cesse de croître.
  • Des nouveaux sites e-commerce apparaissent tous les jours et les enseignes traditionnelles se lancent dans la course de l’e-commerce, avec leur stratégie multicanale associant points de vente physiques et ventes électroniques.

Dans un tel contexte, comment les acteurs de l’e-commerce peuvent-il se positionner face à la concurrence ? Depuis une dizaine d’années, nous accompagnons nos clients avec nos solutions de veille concurrentielle. Toujours reconnus pour la qualité de nos données, nous travaillons sans cesse sur l’innovation de nos outils pour répondre à l’évolution du marché. Avec les dernières avancées dans le domaine du Machine Learning, nous construisons notre nouvelle génération d’algorithmes pour pouvoir couvrir à terme, l’ensemble du marché e-commerce.

Un des défis les plus importants est de pouvoir reconnaître les produits vendus dans chacune des offres. A titre d’exemple, il est facile pour un humain d’identifier qu’une offre intitulée “Apple IPhone 7 256Go noir” correspond à un téléphone de marque Apple, modèle IPhone7, avec 256 Go de capacité de stockage et de couleur Noir. Qu’en est-il pour un ordinateur ? Nous pouvons lui apprendre des règles métier, que la capacité de stockage, la couleur et le modèle du téléphone sont des facteurs clés pour identifier le produit. Mais il faudrait en faire de même pour tous types de produits ! Il faudrait lui apprendre que la longueur, le type du col et le tissu sont des facteurs clés pour identifier des robes. Pour les linges de lit, ça serait plutôt les fils par cm2. Et encore, nous n’avons pas parlé des différents manières de décrire un même produit. En anglais, on peut très bien parler de “running shoes”, “sneakers” ou bien “trainers” pour parler de chaussures de sport.

Vous pouvez donc imaginer qu’à partir de règles métiers décrivant les connaissances de chaque univers de produits, il serait très compliqué de couvrir l’ensemble du marché e-commerce. Il faut donc des algorithmes intelligents capables d’apprendre par eux-même les particularités de tous types de produits.

En se basant sur les informations que nous récupérons sous forme de textes (description, titre, marque, couleur, taille, etc.) et images, nos algorithmes apprennent par eux-même à identifier les produits associés aux offres. En revanche, les algorithmes de machine learning ne “mangent” pas du texte ou des images, ils raffolent des vecteurs ! Il faut bien prémâcher l’information pour obtenir une représentation mathématique des offres, qui contient la sémantique du produit sous la forme de vecteurs.

Toute la puissance de nos algorithmes repose donc sur notre capacité à trouver les meilleures représentations vectorielles des offres. D’un côté, nous implémentons des méthodes de Natural Language Processing (NLP) pour prétraiter et transformer les données textuelles. De l’autre côté, nous implémentons des algorithmes Deep Learning pour encoder les images sous forme de vecteurs des attributs. Nous nous retrouvons donc avec deux représentations mathématiques obtenues indépendamment, à partir du texte et de l’image. Lorsque nous voulons comparer les offres les plus proches, nous fusionnons les deux vecteurs, puis nous cherchons quelles sont les produits avec la représentation vectorielle la plus similaire.

Pour faciliter la tâche et réduire la charge dans la recherche des produits similaires, nous passons par une première étape de classification automatique, de telle sorte que nous comparons ce qui est comparable: chaussures avec des chaussures et télévisions avec des télévisions. D’autant plus, que la catégorisation en soi, nous permet de maintenir un ordre dans notre catalogue !

Puisque la qualité de nos données est notre principale force face à nos clients, nous avons opté pour une démarche de “Active Learning”. Il s’agit d’une méthodologie de travail dans le domaine du machine learning, où les modèles prédictifs interagissent avec des humains, pour valider des actions. Dans un premier temps, toute prédiction doit être validée par un humain et par la suite, nous apprendrons sous quelles conditions nous n’avons pas besoin d’une intervention humaine. Cette démarche nous permet d’automatiser certaines tâches, tout en gardant les tâches à haute valeur ajoutée pour notre équipe de contrôle de qualité.

Voilà un premier aperçu des dernières avancées chez WorkIT . L’incursion dans le monde du Machine Learning est une étape cruciale qui nous permet de rester toujours leader du marché, et pouvoir offrir un catalogue des produits du e-commerce de plus en plus large à nos clients.

Article rédigé par Felipe Aguirre Martinez
Lead Data Scientist chez WorkIT Software – Doctor of Philosophy (PhD), Computer and Information Sciences