HANGZHOU, Chine, 21 septembre 2025 /PRNewswire/ — Dahua Technology, le fournisseur mondial de solutions et de services AIoT axés sur la vidéo, lance officiellement ses Xinghan Large-scale AI Models, un système d’IA de nouvelle génération et de qualité industrielle qui intègre l’intelligence visuelle à grande échelle avec des capacités multimodales et linguistiques. Développé pour relever les défis complexes des environnements réels, Xinghan représente une avancée majeure dans l’innovation continue de Dahua, permettant une transformation intelligente dans divers secteurs.
The Dahua Xinghan Large-Scale AI Model places visual analysis at its core, integrating multimodal capabilities and embedding deep industry expertise to create a large model tailored for diverse application scenarios. Built upon this real-world foundation, it serves as the key to achieving scalable and commercially viable AI solutions.
Fondation technologique du modèle Xinghan
Avec pour mission de permettre aux machines de vraiment comprendre le monde, le système de modèles Xinghan continue d’évoluer en faisant le lien entre la recherche de pointe et les applications du monde réel. D’après le terme chinois signifiant « galaxie », Xinghan offre une matrice de capacités complète alimentée par la synergie edge-cloud pour permettre une intelligence évolutive et adaptative dans tous les secteurs d’activité. L’architecture Xinghan mise à niveau comprend trois séries de modèles principaux : L, V et M. Le modèle de la série L se concentre sur la compréhension du langage naturel et l’interaction, tandis que les deux autres s’attaquent à des applications plus spécifiques :
Série V : modèles de vision Xinghan
Axée sur l’intelligence visuelle avancée et l’analyse vidéo, cette série rationalise les catégories de cibles en se concentrant sur les cibles clés (par exemple, les humains, les véhicules motorisés et les véhicules non motorisés) afin de réduire la complexité du modèle tout en conservant une grande précision.
Principales caractéristiques :
Protection périmétrique : la couverture est étendue grâce à l’identification précise de cibles plus petites (jusqu’à 20×20 pixels) par rapport aux modèles d’IA traditionnels basés sur l’architecture CNN, ce qui permet de réduire les fausses alertes et d’augmenter la portée de détection des caméras grand format*.
WizTracking : offre un algorithme de suivi intelligent de nouvelle génération capable de gérer les occlusions complexes et les variations de la posture de la cible, ce qui permet d’améliorer la précision de 50 %*.
Détection des foules : améliore considérablement la détection des petites cibles à longue distance (jusqu’à 2× plus loin) et dispose d’une compensation de parapluie qui améliore la précision de 80 % par temps de pluie*. Elle offre également une augmentation de 2,5 fois de la portée d’analyse, permet de détecter jusqu’à 5 000 personnes et offre des performances robustes dans les foules denses et les environnements à faible luminosité*.
IA WDR adaptative à la scène : tire parti de la connaissance situationnelle pour analyser les caractéristiques spatiales et contextuelles d’une scène, ce qui permet une configuration intelligente et automatisée de la caméra.
Assistance des règles IA : conçue pour la délimitation automatique des règles d’intrusion de la Protection périmétrique, offrant un accès en un clic, une reconnaissance de scène très précise, une analyse automatique, et plus encore.
Série M : Modèles multimodaux Xinghan
Les modèles multimodaux sont des systèmes d’IA avancés capables de traiter simultanément et d’intégrer en profondeur plusieurs types de données hétérogènes (par exemple, texte, images, audio et vidéo). Cette approche améliore considérablement l’efficacité du traitement de l’information, permet une interaction plus naturelle entre l’homme et l’ordinateur et ouvre un plus large éventail de scénarios d’application.
Principales caractéristiques :
WizSeek : révolutionne l’investigation vidéo grâce à la recherche en langage naturel. Décrivez simplement votre cible (personnes, véhicules, animaux ou objets, etc.) et WizSeek retrouve instantanément les séquences correspondantes dans les archives vidéo enregistrées.
Alarme à définition textuelle : permet aux utilisateurs de définir des alarmes en les décrivant simplement en langage naturel, ce qui abaisse considérablement le seuil de développement et permet une configuration rapide, souple et évolutive adaptée à divers scénarios du monde réel.
Pour plus d’informations sur les modèles Xinghan d’IA à grande échelle, veuillez cliquer ici.
*Les résultats sont basés sur une configuration et un environnement de test standard.
Photo – https://mma.prnewswire.com/media/2777186/image.jpg
Logo – https://mma.prnewswire.com/media/2074657/Dahua_LOGO_Logo.jpg