近日,團(tuán)隊(duì)2023級研究生陸德華、2022級研究生易子怡等在潘家輝教授、黃海云副研究員的悉心指導(dǎo)下,在中科院二區(qū)期刊《IEEE Transactions on Instrumentation and Measurement》成功錄用學(xué)術(shù)論文“Confdence-Aware Multimodal Network for Driver Drowsiness Detection: Leveraging EEG-EOG Signals Enhanced by Knowledge Distillation”。該論文自2024年10月提交,于2025年7月8日被正式接收。
駕駛員疲勞是導(dǎo)致交通事故的主要原因,因此迫切需要先進(jìn)的疲勞檢測系統(tǒng)。生理信號的整合,特別是腦電圖(electroencephalography , EEG)和眼電圖(electrooculography, EOG)在該領(lǐng)域顯示出優(yōu)異的前景。然而,現(xiàn)有的方法面臨多模態(tài)融合精度低和復(fù)雜模型計(jì)算量大的挑戰(zhàn)。在本文中,我們提出了一種新的多模態(tài)疲勞檢測框架,稱為EEG-EOG置信度感知網(wǎng)絡(luò)(EECNet),用于解決上述問題。EECNet使用深度通道注意轉(zhuǎn)換(DCAT)模型有效地提取局部和全局EEG特征,而EOGNet則提取EOG特征。置信度感知模塊用于評估每個模態(tài)的可靠性,從而提高多模態(tài)信息融合檢測精度和魯棒性。此外,本文還利用知識蒸餾(knowledge distillation, KD)來開發(fā)輕量級模型,從而有效地平衡復(fù)雜性和性能。在公共數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,EECNet超過了最先進(jìn)的方法,平均準(zhǔn)確率達(dá)到95.68%,從而顯示了其在檢測駕駛員困倦方面的優(yōu)越性能。
亮點(diǎn):
方法:
EECNet的主要架構(gòu)分為三個主要部分:單模態(tài)處理、置信度感知融合模塊和分類器,如圖1所示。
圖 1 EECNet主體架構(gòu)
首先是單模態(tài)處理。我們使用了不同的方法來處理EEG和EOG信號。對于EEG,我們使用了深通道注意轉(zhuǎn)換器(DCAT)模型。這個模型擅長挑選出重要的細(xì)節(jié),包括局部特征和全局特征,這有助于下一步對數(shù)據(jù)進(jìn)行分類。對于EOG信號,我們首先使用特征提取器Feature Extractor,然后添加GhostModule使處理更加精確更加快速。
在置信度感知融合模塊中,置信度感知模塊首先通過置信度評估過程對每個信號特征關(guān)聯(lián)的可靠性進(jìn)行評估,然后再對這些特征進(jìn)行融合。該置信度感知模塊有別于傳統(tǒng)的Maximum Class Probability (MCP), 而是利用True Class Probability (TCP)去更加精確的評估各個模態(tài)的置信度。
圖 2 置信度感知模塊架構(gòu)。回歸任務(wù)用于獲取TCP值。分類任務(wù)用于生成預(yù)測TCP值。
最后,實(shí)現(xiàn)了分類器來執(zhí)行分類任務(wù)。該分類器作為決策過程的最后一步,根據(jù)聚合的特征和評估的置信度確定適當(dāng)?shù)姆诸悺榱藵M足實(shí)際需要,我們在教師模型的基礎(chǔ)上,采用知識精餾的方法,對參數(shù)數(shù)量減少的學(xué)生模型進(jìn)行訓(xùn)練。學(xué)生模型和教師模型僅僅有結(jié)構(gòu)層數(shù)的不同。
實(shí)驗(yàn)結(jié)果:
我們在公開數(shù)據(jù)集SEED-VIG上做了大量實(shí)驗(yàn)來驗(yàn)證EECNet模型和知識蒸餾方法的有效性。具體的表現(xiàn)如下列各表所示。結(jié)果表明我們的方法能夠在同樣測試環(huán)境取得非常優(yōu)異的結(jié)果,突出了方法的有效性。
表 1 各模型在SEED-VIG數(shù)據(jù)集分類任務(wù)表現(xiàn)
表 2 各模型在SEED-VIG數(shù)據(jù)集回歸任務(wù)表現(xiàn)
表 3 單-多模態(tài)知識蒸餾前后師生模型的性能比較
結(jié)論:
本研究提出了一種新的多模態(tài)駕駛員疲勞檢測模型,利用EEG和EOG數(shù)據(jù)來解決該領(lǐng)域的關(guān)鍵挑戰(zhàn)。該模型解決了諸如多模態(tài)數(shù)據(jù)融合、不同置信水平和模型復(fù)雜性等挑戰(zhàn)。通過采用信心感知融合和知識蒸餾,我們開發(fā)了一個既準(zhǔn)確又實(shí)用的模型,可以在現(xiàn)實(shí)世界中使用,正如它在SEED-VIG數(shù)據(jù)集上的表現(xiàn)所證明的那樣。綜上所述,本研究在駕駛疲勞檢測領(lǐng)域取得了重大進(jìn)展,為今后的研究提供了明確的方向。