في الآونة الأخيرة ، وانغ تشيوان ، الباحث في قسم التصوير الطيفي ، وشيان معهد البصريات و ميكانيكا ، الأكاديمية الصينية للعلوم ، حققت تقدما جديدا في الكشف عن الشواذ و التعريب من الصفر عينات في مجال الرؤية الحاسوبية . الكاتب الأول هو جين تاو مينغ ، وهو طالب دراسات عليا في عام 2024 ، وشيان معهد البصريات و ميكانيكا ، المراسلات الكاتب هو جين تاو تسونغ ، دكتوراه ، مستشفى جنوب الوسطى ، جامعة ووهان ، وشيان معهد البصريات و ميكانيكا هو bingliang والباحث وانغ تشيوان ، وشيان معهد البصريات و ميكانيكا هو أول وحدة الاتصالات .
جنبا إلى جنب مع الطلب المتزايد على الجودة الصناعية ، وتحليل الصور الطبية ، الشذوذ الكشف عن التكنولوجيا قد جذبت المزيد والمزيد من الاهتمام . ومع ذلك ، في كثير من الأحيان نادرة أو حتى من الصعب الحصول على عينات غير طبيعية في المشهد الحقيقي ، و أساليب التعلم التقليدية تعتمد على الشرح البيانات تواجه عنق الزجاجة .
على الرغم من أن الكشف عن الشواذ على أساس نموذج البصرية واللغوية يمكن أن يتحقق من دون أي علامات على نطاق واسع قبل التدريب المعرفة ، فإنه لا يزال يواجه ثلاثة تحديات في غرامة الحبيبات الكشف عن الشواذ . ثانيا ، تعتمد على نص واحد التمثيل ، التعبير الدلالي قدرة محدودة . ثالثا ، هناك عدم اليقين في الدلالات مطابقة بين الصورة والنص ، مما يحد من تحسين أداء النموذج .
من أجل حل هذه المشاكل ، فريق البحث طرح إطار جديد ، FB كليب . ويبتكر هذا الإطار على ثلاثة مستويات :
من خلال الجمع بين الجملة على مستوى التمثيل ، السياق العالمي المعلومات والاهتمام ميزة الترجيح ، ونحن بناء المزيد من التمثيل الدلالي مهمة الإدراك ، وتحسين القدرة على فهم نموذج غير طبيعي المعاني .
في النمذجة البصرية ، ونحن تصميم متعدد زاوية الرؤية الأمامية والخلفية فصل آلية فصل ملامح الصورة من البعد الدلالي ، والفضاء ، وهيكل ، وهلم جرا .
من أجل تحسين القدرة على التمييز بين الشذوذ من خلال تعزيز الثقة في التنبؤ وتوسيع الفجوة الدلالية بين العادي و الشذوذ عينات .
النتائج التجريبية تبين أن fb-clip يحقق أداء ممتاز في العديد من مجموعات البيانات الصناعية والطبية ، وخاصة في غرامة الحبيبات الشذوذ التعريب المهام . هذه الطريقة لا تحتاج إلى عينة غير طبيعية الشرح ، ويمكن تحقيق دقة الكشف عن موقع صغير غير طبيعي في مجمع المشهد .
النتائج التي تم الحصول عليها من هذه الدراسة يمكن أن تستخدم في مجالات مثل التصوير الطبي والتشخيص بمساعدة الصناعية الكشف عن الخلل .
وانغ تشيوان ، وشيان معهد البصريات و ميكانيكا ، وقد تم البحث في العديد من المجالات ، مثل الرؤية الحاسوبية ، التصوير الطبي الحيوي ، الدماغ والذكاء الاصطناعي ، وما إلى ذلك في السنوات الأخيرة ، وقد تم إحراز تقدم كبير في المجالات ذات الصلة .
مؤتمر IEEE / CVF الكمبيوتر الرؤية والتعرف على الأنماط هي واحدة من الاكثر نفوذا في المؤتمر الدولي في مجال الرؤية الحاسوبية .