Korben - Magika, le détecteur de fichiers ultra-rapide de Google (OpenSource)

Un fichier c'est une suite de données, avec dans son nom une extension qui est censée dire "ben .jpg c'est une image au format JPEG" par exemple.
L'idée ici avec cette IA c'est surtout d'avoir à lire le moins possible de données du fichier pour essayer d'identifier ce que c'est.  Donc le faire le plus rapidement possible surtout avec plein plein de fichiers.

A quoi ça peut servir ?

  • par exemple à nos outils de sécurité pour pre-valider qu'un fichier .DOC en est bien un, et pas un malware maquillé
  • ou pour les logiciels d'édition de texte.  Par exemple mon NotePad++, en ouvrant un fichier ou en copy/paste du code pourrait détecter quel langage c'est et mettre la bonne coloration syntaxique
  • ...
Magika, le détecteur de fichiers ultra-rapide de Google

Image de tétection de types de fichiers
korben.info

Et sinon pour la doc de l'outil OpenSource, je cite Korben, c'est par là:

Pour en savoir plus sur la façon de l’utiliser, je vous invite à vous rendre sur la documentation de Magika.

Haut de page