谷歌近日正式推出AI驱动的文件类型识别工具Magika 1.0稳定版,标志着该系统迈入新阶段。此版本核心引擎已完全以Rust重构,既提升运行速度又增强内存安全性;新架构支持每秒处理上千文件,性能显著优化。系统依托ONNX Runtime实现模型推理,结合Tokio达成异步并行处理,目前可识别200余种文件格式,覆盖数据科学、现代编程、DevOps及图形数据库等多领域。为应对训练数据挑战,团队采用SedPack高效加载3TB以上数据,并借助Gemini生成合成样本弥补稀有格式缺失。开发者可通过原生客户端或Python、TypeScript模块便捷集成。免责声明:本文内容由开放智能模型自动生成,仅供参考。