Encord obtient de nouveaux fonds pour développer ses outils d'étiquetage de données pour l'IA

Les plateformes d'étiquetage et d'annotation n'attirent peut-être pas l'attention des nouveaux modèles IA générateurs flashy. Mais elles sont essentielles. Les données sur lesquelles de nombreux modèles s'entraînent doivent être étiquetées, sinon les modèles ne pourraient pas interpréter ces données pendant le processus d'entraînement.

L'annotation est une tâche immense, nécessitant des milliers à des millions d'annotations pour les ensembles de données plus importants et plus sophistiqués en cours d'utilisation. Pour aider à alléger le fardeau, Eric Landau et Ulrik Hansen ont fondé Encord, qu'ils décrivent comme une plateforme de « développement de données » pour les entreprises qui gèrent et préparent leurs données pour les modèles IA.

Maintenant, l'entreprise dispose de 30 millions de dollars supplémentaires dans ses caisses grâce à un tour de financement de série C mené par Next47. Portant la réserve de guerre d'Encord à 50 millions de dollars, le nouveau capital servira à doubler la taille des équipes de produit, d'ingénierie et de recherche en IA d'Encord au cours des six prochains mois et à étendre les bureaux de l'entreprise à San Francisco, a déclaré Landau à TechCrunch.

« D'ici la fin de l'année, nous prévoyons de faire passer notre équipe à 100 employés, contre 70 actuellement », a-t-il ajouté. « Nous avons désormais des sièges sociaux à Londres et à San Francisco avec des membres de l'équipe à travers le monde. »

Landau a commencé à travailler avec des systèmes de big data en effectuant des recherches en physique des particules alors qu'il était étudiant de premier cycle à Stanford. Hensen a travaillé sur les marchés mondiaux chez J.P. Morgan, où il traitait des produits dérivés des marchés émergents.

Hensen explique que l'idée d'Encord lui est venue alors qu'il travaillait sur des projets IA intensifs en données lors d'un programme de master en informatique au Imperial College London. Frustré par la nature chronophage de la curation et de l'étiquetage des données, Hensen a rencontré Landau, qu'il connaissait de la scène entrepreneuriale londonienne, pour discuter des moyens de résoudre ensemble le problème des données.

Crédits image: Encord

« En combinant l'expertise en développement de logiciels de Hensen avec mes connaissances issues de la recherche quantitative pour automatiser le développement des données, nous avons lancé la première itération du produit d'Encord lors de Y Combinator au printemps 2021 », a déclaré Landau à TechCrunch. « La plateforme d'Encord équipe les entreprises d'outils pour préparer leurs données pour l'IA et évaluer dans quelle mesure ces données soutiennent leurs modèles. »

Avec la taille du marché de l'étiquetage et de l'annotation des données estimée à 3,6 milliards de dollars d'ici 2027, Encord est l'un des nombreux fournisseurs en concurrence pour les contrats. Outre l'éléphant dans la pièce - Scale AI - il y a des startups comme Datasaur, qui permet aux clients de créer automatiquement des modèles à partir d'ensembles d'étiquettes; Heartex, qui construit une plateforme d'étiquetage de données open source; et le fournisseur d'outils d'annotation de données Dataloop.

Encord se distingue, selon Landau, par la polyvalence de sa plateforme.

En utilisant Encord, les équipes peuvent explorer et visualiser des ensembles de données - y compris des ensembles de données d'images, de vidéos et de voix - provenant de stockage en nuage privé et public et comparer les performances de différents modèles entraînés sur les mêmes ensembles. La plateforme tente de détecter les problèmes de précision du modèle et suggère des données supplémentaires d'entraînement qui pourraient aider à rectifier ces problèmes.

« Contrairement aux solutions morcelées qui ne traitent que des parties spécifiques de votre pile de données, Encord vous permet de consolider tous vos flux de données dans une seule plateforme », a déclaré Landau. « Grâce à cette consolidation, les entreprises acquièrent une traçabilité qui éclaire la 'boîte noire' souvent opaque de l'IA, aidant à comprendre pourquoi un modèle prend des décisions spécifiques. »

Crédits image: Encord

La stratégie d'Encord semble bien fonctionner jusqu'à présent. La société compte 120 clients, dont Philips, la start-up AI buzz Synthesia, et les prestataires de soins de santé Cedars-Sinaï et Northwell Health, ainsi que des contrats avec des agences militaires et gouvernementales non nommées. Landau affirme qu'Encord a augmenté son chiffre d'affaires de 4 fois au cours de la dernière année et pourrait générer des liquidités positives d'ici 2025 si elle ne continuait pas à augmenter ses effectifs.

« Nous ressentons l'effet inverse d'un ralentissement », a déclaré Landau. « Cela dit, nous sommes conscients des conditions du marché plus larges et avons adopté une approche prudente en matière de déploiement de capital. »

D'autres participants à ce nouveau tour de financement incluaient Y Combinator, CRV et Crane Venture Partners.