【例會(huì)預(yù)告】
會(huì)議名稱:數(shù)據(jù)科學(xué)與創(chuàng)新管理團(tuán)隊(duì)例會(huì)
會(huì)議時(shí)間:2026年4月29日(周三)晚上19:00-21:00
會(huì)議地點(diǎn): 經(jīng)管樓609會(huì)議室
匯報(bào)人:李虎峰
匯報(bào)題目:
《對(duì)DAC方法的幾點(diǎn)再補(bǔ)充》
匯報(bào)摘要:
在相較于傳統(tǒng)的實(shí)證、案例等研究方法,數(shù)據(jù)驅(qū)動(dòng)分析方法(Data-driven Analysis for studying the influence mechanism of Complex factors,DAC)綜合了定量和定性研究的優(yōu)勢(shì),通過機(jī)器學(xué)習(xí)的方法研究復(fù)雜系統(tǒng)關(guān)鍵核心因素的機(jī)制。有助于提供基于企業(yè)異質(zhì)性的高度細(xì)分的管理建議,通過CART決策樹有助于理解要素間存在的高階交互作用。在前序的匯報(bào)中,針對(duì)DAC方法的異質(zhì)性分析、決策樹結(jié)果的穩(wěn)健性,決策樹得到路徑的顯著性等問題開展了一些探討。(2025年11月20日例會(huì)預(yù)告-李虎峰《一種基于DAC方法的統(tǒng)計(jì)學(xué)檢驗(yàn)思路》)
然而,在整個(gè)DAC執(zhí)行流程中,仍然存在一些不可忽視的問題,例如,在K-Means聚類過程中,由于隨機(jī)初始種子的設(shè)定,我們每次聚類得到的結(jié)果往往并不穩(wěn)健,尤其是針對(duì)一些本身分類就較為模糊的點(diǎn),不同聚類批次可能存在較大的差池。另一方面,在通過爬山算法等方法構(gòu)建貝葉斯網(wǎng)絡(luò)的過程中,對(duì)連續(xù)變量的離散化分箱方式可能也會(huì)對(duì)結(jié)果產(chǎn)生一些的影響。因此,還需要探討更加穩(wěn)健的聚類方式(從數(shù)據(jù)或是算法層面進(jìn)行優(yōu)化),并對(duì)貝葉斯網(wǎng)絡(luò)的結(jié)果進(jìn)行進(jìn)一步的穩(wěn)健性檢驗(yàn)(MNLogistic回歸和針對(duì)網(wǎng)絡(luò)結(jié)果的安慰劑檢驗(yàn)),對(duì)方法進(jìn)行進(jìn)一步的補(bǔ)充,同時(shí)研究使用了GeNIe軟件分析貝葉斯網(wǎng)絡(luò)結(jié)果,能夠得到信息更加豐富的分析內(nèi)容。

圖1 基于GeNIe軟件構(gòu)建的貝葉斯網(wǎng)絡(luò)

圖2 目前對(duì)DAC方法的內(nèi)容補(bǔ)充