Nous rencontrons aujourd’hui Claude de Loupy, co-fondateur de Syllabs, société de technologie spécialisée en analyse sémantique et génération de contenus textuels

Lali Dugelay : Bonjour Claude de Loupy, merci d’accorder cet entretien à Business Actor. Pouvez-vous présenter votre parcours ?

Claude de Loupy : Bonjour, merci à vous de m’avoir proposé cette interview. Informaticien de formation, je suis tombé amoureux en fin d’études d’un domaine très particulier, appelé « traitement automatique des langues », vulgairement nommé « sémantique ». Après deux années passées au CNRS à Aix-en-Provence sur un projet européen, j’ai commencé une thèse en entreprise à Bertin Technologies concernant les moteurs de recherche. J’ai ensuite passé un an d’enseignement à l’université d’Avignon pour terminer ma thèse puis en 2000 j’ai rejoint Sinequa, spécialiste des moteurs de recherche, où j’ai créé et géré le laboratoire interne de recherche pendant cinq ans.

En parallèle, j’ai occupé un poste de professeur associé (de 2003 à 2009) à l’université Paris-X où j’ai enseigné à des Master 2 les méthodes des moteurs de recherche et du traitement des langues.

En 2005, j’ai décidé de faire un break et suis parti au Caire pour suivre ma future épouse. Loin de mon monde habituel, j’ai compris que j’avais besoin d’autre chose et j’ai décidé de me lancer dans l’entreprenariat.

En août 2006, nous avons créé Syllabs avec mon associée Helena Blancafort, traductrice-linguiste et ex-collègue à Sinequa.

Lali Dugelay : Pouvez-vous présenter l’organigramme de Syllabs ?

Claude de Loupy : Nous sommes onze. Mon associée Helena a un passé en traduction (8 langues parlées !), puis des études en traitement automatique des langues mais plutôt du côté linguistique, ce qui permet de croiser nos points de vue (linguistique vs informatique/probabilités) de manière intéressante et complémentaire. Helena s’occupe également de la gestion interne tandis que je suis plus à l’extérieur (notamment pour gérer l’aspect commercial et les partenariats).

Nous sommes actuellement en phase de croissance et recrutons deux personnes supplémentaires (un ingénieur R&D et une personne à la communication). L’équipe présente un profil diversifié avec, en plus de moi, trois linguistes (dont mon associée), quatre informaticiens qui s’occupent du développement, une documentaliste (puisqu’on travaille pas mal sur de la catégorisation d’informations), un responsable marketing produit et une assistante de direction.

logo_CMJN-transparent

Lali Dugelay : Qu’est-ce que Syllabs ? Quelles prestations propose-t-elle ? Quel est le concept ? Quelle en est la finalité ?

Claude de Loupy : Syllabs est une startup spécialisée en sémantique qui propose des services personnalisés basés sur trois types de technologies :

  • Le web mining (l’extraction d’information sur le Web) : nous pouvons aller chercher de l’information sur le Web via nos crawlers  « intelligents » et une analyse sémantique du contenu des pages Web.Syllabs 4
  • Le text mining (l’analyse des informations présentes dans les textes pour en extraire de la connaissance) : nous extrayons de l’information structurée de textes bruts. Nous proposons, entre autres, de l’analyse d’opinion, de l’extraction de relations entre personnes, entreprises, fonctions ou de la catégorisation thématique.
  • La content generation (on génère des textes de façon automatique à partir de connaissances) : si nous avons une base de données structurée en entrée (par exemple l’ensemble des caractéristiques de milliers d’appareils photo), nous pouvons générer un texte de qualité humaine utilisant ces données (comme un descriptif des appareils photo).

Selon les besoins de nos clients, nous utilisons un ou plusieurs de ces composants pour proposer des applications dédiées que nous mettons alors à disposition sous forme de web services sur notre plateforme SaaS.

Lali Dugelay : Concrètement, comment cela fonctionne-t-il (notamment, d’un point de vue technique) ? Vous insistez sur l’aspect humain de votre outil ; n’est-ce pas antinomique, pouvez-vous développer cette idée ?

Claude de Loupy : Les technologies que nous avons développées pendant ces six années sont toutes basées sur les trois principes suivants :

  • Elles doivent pouvoir être spécialisées rapidement et à un coût abordable.
  • La machine est au service de l’expert humain (ce sont nos linguistes qui ont le dernier mot dans les règles d’analyse même si nous utilisons de manière très forte des techniques d’apprentissage automatique).
  • Les traitements doivent être rapides : notre outil est soixante-dix fois plus rapide que ceux de certains de nos concurrents ; l’un de nos clients nous pose sept millions de requêtes par jour et cela pourrait tenir sur un seul serveur (ce que nous évitons pour des raisons de sécurité).

Syllabs 2Concernant la génération automatique de textes, le besoin du client est généralement le référencement dans les moteurs de recherche. Pour être correctement référencé, il faut proposer des textes uniques, de qualité humaine car ces moteurs font des tests pour vérifier que le contenu se tient, avec une certaine cohérence sémantique par rapport à l’objectif visé. On ne peut pas parler de n’importe quoi pour être référencé.

D’un point de vue technologique, pour faciliter le travail des experts, nos informaticiens ont développé des langages de programmation dédiés qui sont utilisés par les linguistes. En fait, les linguistes sont des programmeurs mais dans un langage spécialisé pour l’analyse linguistique, que ce soit pour le text mining ou la génération de contenu. Donc quand on va faire de l’analyse d’opinion ou de la génération sur un certain thème, la linguiste commence déjà par se poser la question de savoir comment les gens peuvent parler de telle ou telle information, quel est le vocabulaire approprié à tel domaine, pour ensuite aller coder des règles à l’aide de ce langage.

Donc en effet ce n’est pas la machine qui fait tout : on a des experts et on spécialise chacune des analyses : le web mining est spécialisé, le text mining aussi, la génération de contenu également. C’est l’une des différenciations par rapport à certains de nos concurrents.

Lali Dugelay : Pouvez-vous nous parler de la Web intelligence ?

Syllabs 3Claude de Loupy : La Web intelligence est un vaste domaine qui englobe énormément de choses, depuis la représentation des connaissances jusqu’aux objets connectés. Difficile d’en parler de manière globale. Mais je peux vous dire en quoi nous nous inscrivons dans ce nouveau domaine.

La combinaison de nos trois ensembles de technologies nous permet, par exemple, de créer, de manière automatique ou semi-automatique, des catalogues complets de produits, en allant chercher les informations sur les sites des constructeurs, en les analysant et en les restituant sous forme de tableaux de caractéristiques et de descriptifs.

Il s’agit donc bien de Web intelligence dans le sens où nous nous utilisons le Web pour acquérir de la connaissance, l’enrichir, la corroborer, et la restituer sous forme de bases de données ou de textes.

Lali Dugelay : Pouvez-vous présenter quelques exemples concrets de vos produits et réalisations ?

Claude de Loupy : Nos technologies s’appliquent à des problématiques très diverses. Nous avons ainsi créé des catalogues complets pour certains de nos clients (catalogues de réfrigérateurs, de chaussures, d’hôtels, etc.) avec les caractéristiqSyllabs-Canonues des produits, des descriptifs textuels et parois des résumés d’avis. Un exemple de catalogue de ce type peut être vu sur nos sites de démonstration Panorama des numériques et Camera square qui ont été créés à partir de rien en 3 semaines et comportent plus de 1000 appareils photos avec descriptifs en français et en anglais.

Notre solution de Itext mining a été utilisée dans des contextes d’analyse d’opinion. Cette analyse est bien évidemment spécialisée de manière à obtenir de bons résultats (avis sur des hôtels, des régions touristiques, etc.). Nous avons également fait des analyses de petites annonces pour en extraire des informations structurées (surface d’un appartement, nombre de pièces, etc.)

Syllabs-footDans des contextes de médias, nous sommes en train de créer un agrégateur de type Google News spécialisé dans l’économie. Nous avons également créé une application de suivi de la réputation des joueurs de foot pendant l’Euro 2012 avec nos partenaires Opta et Intactile Design ou une dataviz sur la relation Franco-Allemande depuis 50 ans.

Lali Dugelay : Qui sont vos clients ? Vos offres ne concernent-elles que l’e-tourisme et l’e-commerce ? Avez-vous d’autres perspectives et objectifs de développement ?

Claude de Loupy : Nous travaillons principalement avec des PME, mais sommes de plus en plus impliqués auprès de grands comptes. Nos offres concernent tout type de business à partir du moment où il y a de l’information textuelle à traiter ou à créer. Cela dit, nous avons effectivement développé une compétence particulière sur l’e-commerce et l’e-tourisme et voulons développer des produits spécifiques à ces domaines dans un format « sur étagère ». Nous avons également une bonne expérience sur les médias et la finance et nous allons la développer.

Lali Dugelay : Votre entreprise a vu le jour en août 2006. Comment expliquez-vous la longévité de votre entreprise, à l’heure de la crise ? Quels sont vos objectifs et perspectives d’évolution à court et moyen terme ?

Claude de Loupy : Nous avons connu plusieurs étapes à Syllabs. Nos quatre premières années ont été consacrées à du service et du conseil afin de nous financer pendant que nous développions certaines de nos technologies en parallèle. À partir de mi-2010, nous avons commercialisé nos produits, en commençant par le text mining puis en y ajoutant la génération de contenu et le web mining.

Depuis mi-2011, nous verticalisons certaines technologies, en particulier dans les domaines du e-commerce et du e-tourisme.

Pour être franc, 2012 fut une année difficile pour nous mais nous avons passé le cap et cela nous a même aidés à clarifier bon nombre de choses sur nos objectifs et notre stratégie. 2013 redémarre bien, nous avons signé avec de beaux clients et nous sommes optimistes.

À court terme, nous voulons faire connaître plus largement nos offres afin d’augmenter notre chiffre d’affaires. À moyen terme, nous visons des offres « sur étagère » sur certains verticaux afin de minimiser l’investissement humain nécessaire sur chaque client et pouvoir changer d’échelle.

Lali Dugelay : Qui sont vos concurrents sur le marché ? Comment vous différenciez-vous d’eux ?

Syllabs1Claude de Loupy : Comme nous proposons une large gamme de produits, nous avons des concurrents très différents selon les cas. Pour le text mining pur, il existe une dizaine d’entreprises en France et des centaines dans le monde. Nous nous différencions d’elles par notre capacité à proposer des traitements spécialisés à moindre coût, par une très grande rapidité d’analyse et une forte connaissance du Web.

Pour la génération, il existe une entreprise comme la nôtre aux États-Unis et quelques autres qui sont un peu différentes un peu partout dont une en France mais nos vrais concurrents sont les plateformes de rédaction off-shore. Nous nous différencions d’eux par la capacité à créer des milliers de textes par jour après une semaine de configuration, par une qualité constante quel que soit le nombre de textes créés et un coût inférieur.

Lali Dugelay : Exploitez-vous les canaux de réseaux sociaux pour vous faire connaître ? Comment communiquez-vous ? Quels sont vos moyens/actions de communication ?

Claude de Loupy : Nous communiquons actuellement de manière très artisanale sur notre blog, et Twitter. Un peu de Slideshare également. Mais nous sommes à la recherche d’un community manager car nos produits attirent les gens qui en entendent parler et nous devons donc professionnaliser notre communication.

Lali Dugelay : Sauriez-vous définir la philosophie de l’entreprise ? Les valeurs auxquelles elle est attachée ? Pour quelles raisons pourrait-on avoir envie de travailler chez vous ?

Claude de Loupy : L’une des personnes que nous avons embauchée me disait qu’elle était venue chez nous car nous travaillons comme des artisans qui aiment leur travail. Il me semble que cela nous caractérise bien.

Syllabs est ce que l’équipe en fait. Nous travaillons sur un domaine passionnant où presque tout reste à faire malgré des décennies de recherche.  Nous proposons un lieu unique où l’on peut à la fois faire de la recherche en méthodes d’apprentissage, de la modélisation linguistique, du développement informatique de haut niveau (systèmes distribués, NoSQL, SaaS), etc.

 Lali Dugelay : Comment nos lecteurs peuvent-ils vous contacter, suivre votre actualité ?

Claude de Loupy : notre site, notre blog, notre Twitter (@syllabs, @cdeloupy, @hblanca et LinkedIn.)