*清華大學(xué)自動化系統(tǒng)工程研究所教授姚丹亞在上海車展新智駕&MMC沙龍現(xiàn)場 有一篇來自清華大學(xué)的論文名叫《基于完全信息動態(tài)博弈的無燈控交叉口的車輛協(xié)同駕駛模型》(作者:楊卓,姚丹亞),,它試著解決了一個可能很多人都想過但還沒有解決的問題,,那就是使自動駕駛汽車在路口會車時相互協(xié)調(diào),最終彼此配合完成通行決策,。 你可以將它看作V2X助力自動駕駛決策的應(yīng)用之一,。對于V2X對自動駕駛的作用,人們談得更多的是V2X在環(huán)境感知中的作用,,即除汽車自身的傳感器感知外,,借助V2X完成更大范圍的環(huán)境感知。 但V2X還有一個重要作用,,就是協(xié)同決策,。目前我們能做到在自主感知的基礎(chǔ)上決策,但V2X環(huán)境使“群決策”成為可能,,在可能在未來會是自動駕駛中的一個重要應(yīng)用,。 如何基于V2X實現(xiàn)群決策? 以一個具體的場景為例,,即無信號交叉路口的車車協(xié)同,。兩輛車抵達路口,在沒有控制中心的情況下,,聽誰的,?它們之間是一個博弈的關(guān)系,要通過博弈,,保證雙方安全又順利地通過交叉路口,。 首先,做一個簡單的場景描述,。 1,、存在參與車輛,,左邊駛來一輛車,下方駛來一輛車,,已知彼此的速度,、加速度和位置,以及達到路口會車點的距離,。 2,、路口為無信號交叉路口,即在沒有信號燈控制,。 3,、存在V2X環(huán)境,車車間可以進行交互,。 以上是前提假設(shè),。接下來將問題拆分。 第一,,判斷車輛間是否存在沖突,。我們選擇一個指標(biāo)來描述這個沖突,這個指標(biāo)就叫作“沖突時間差”,,即兩輛車到達沖突點的時間差值,。該差值越小,就越有可能相撞,,如為零則相撞,,如差值很大,則代表在完全不同的時刻通過交叉點,,定不會相撞,。 第二,如果存在沖突,,如何提前避免,。在這個部分要考慮的因素很多,為了保證安全,,當(dāng)兩輛車存在沖突時,,需要用一個算法保證它們最后不相撞,。因此,,二者通過路口可以看成一個博弈問題。博弈包括三個要素,。
以上就是一些決策的基本場景假設(shè)。 基于此,,兩輛車的路口博弈在數(shù)學(xué)上可以看作一個有約束的多目標(biāo)規(guī)劃問題,。即,將不同加速度組合的情況下,,使獲得的收益“Ω”達到最大,。其中涉及一些數(shù)學(xué)問題,如多重納什均衡,、求最優(yōu)解等,,我們在這個模型中是用遺傳算法求取最優(yōu)解。 下面就具體地來計算這個問題,。 對于兩輛車,,首先要判斷其是否進入沖突區(qū)。博弈系統(tǒng)的實例模型如下所示,,紅點表示沖突點(碰撞的點),,通過車輛到達沖突點的時間差判斷是否進入沖突區(qū)域。 *出自該模型作者曾發(fā)表的論文 若兩輛車并未進入沖突區(qū),,則不需要博弈,,正常行駛即可。一旦進入沖突區(qū),,博弈即開始,,通過博弈使得收益最大。前面講到三個收益指標(biāo)(安全、快速,、舒適),,此時就要具體定義這三個指標(biāo)。 1,、安全性指標(biāo),。安全性指標(biāo)指已到達沖突點的時間差,在這個模型中,,該差值一定要大于某個給定的閾值,,才能確保安全。這個公式比較簡單,,基本是中學(xué)時候關(guān)于距離,、速度、時間的簡單公式,。 2,、快速性指標(biāo)。指的是兩個周期內(nèi)速度的變化,,是當(dāng)前時刻加速度值的直接反應(yīng),。 3、舒適性指標(biāo),。舒適性指標(biāo)其實可以直接用加速度的絕對值來表示,,絕對值越大,舒適型越差,,在這個模型中我們基本選擇0.25g加速度指標(biāo)來進行博弈,。當(dāng)然,前提還是要安全,,如果要發(fā)生碰撞了,,那么舒適性指標(biāo)是可以犧牲的。此外,,舒適性指標(biāo)也定義了一些不良加速度行為,,如加速度增幅達到200%,或是該加速時變成反向加速度等,。 對于以上三個收益值,,需要做一個標(biāo)準(zhǔn)化的工作。三種數(shù)據(jù)的量綱不同,,有的是時間,,有的是加速度,如何求和呢,?這其中就涉及到標(biāo)準(zhǔn)化問題,。這里不具體解釋,基本的計算方法是將當(dāng)前值減去期望值除以標(biāo)準(zhǔn)差,。最后,,需要用到遺傳算法,盡可能得到全局最優(yōu)解,。 仿真實驗 對于這套理論,,我們還沒有用在實車控制中,只是進行了仿真實驗,。這是個具體的仿真例子,。兩輛車初始速度分別為60km/h和50km/h,距離沖突點的距離分別為250米和150米,,設(shè)定約束條件:最大速度不能超過70km/h,,最小速度是零(即停車),加速度值控制在±0.3g之間,。用于求解的遺傳算法在此不贅述,,它主要用于獲得最優(yōu)解的。下圖,,是兩車路口會車的仿真實驗結(jié)合曲線圖,。 *出自該模型作者曾發(fā)表的論文 從上圖可以看出,這次仿真實驗得到了蠻有意思的結(jié)果,。在這個場景下,,兩輛車出現(xiàn)了兩次博弈的過程。第一次,,計算得出到?jīng)_突點的時間差小于給定閾值,,進行了一輪博弈后,沖突危險解除,,判斷安全后又開始自由駕駛,;自由駕駛一段時間以后又進入了一次博弈過程,最后直到車輛安全通過路口,。 上面的圖給出了許多博弈曲線,。第一排曲線是收益曲線,紅色,、藍色代表兩輛車分別的收益,,綠色表示兩輛車的總收益。第二排是加速度曲線,,拿加速度曲線來說,,博弈的效果不是特別好,因為跳動很大,,博弈算法還有些需要完善的地方,。第三排是速度曲線,。 最后一排的碰撞時間差(TDTC)。我們?yōu)門DTC設(shè)置一個閾值,,當(dāng)TDTC小于閾值的時候,,就會告知存在碰撞風(fēng)險,開始博弈,。而這個過程是變化的,,一旦TDTC超出閾值,就證明沒有風(fēng)險,,雙方就可以自由駕駛,。最后車輛安全駛離交通路口,這是一個完整的博弈過程,。 在一些具體參數(shù)上,,主要考慮三點。
總結(jié) 該模型的研究,,考慮到了駕駛安全、舒適等指標(biāo)之間的博弈和決策,,避免碰撞是最重要的部分,,同時也要盡可能避免那些降低舒適性的操作,。未來,通過豐富策略集,,可以在模型的基礎(chǔ)上,,有更多方向、更多方式的相關(guān)研究,。 同時,群決策算法是一個亮點,。剛才只是兩輛車的模型,,我們的博士生還在研究路口多車博弈的通用模型。 當(dāng)然,,我們現(xiàn)在的實驗還在仿真基礎(chǔ)上,,不過也在做一些實用的產(chǎn)品。我們課題組和一個叫作星云互聯(lián)的公司合作,,開發(fā)了一些V2X的產(chǎn)品,,如智能車載終端、路側(cè)通信機,、路側(cè)主機等,,其中內(nèi)置了多種通信模塊,支持多種通信方式接入,,完成車車,、車路之間的數(shù)據(jù)交互。目前我們的產(chǎn)品,,主要應(yīng)用在各種自動駕駛和智能駕駛測試場,,同時,還推出了了一些實際應(yīng)用,。例如我們在校園公交系統(tǒng)中裝入了路側(cè)系統(tǒng),、校園公交車上安裝了車載裝置,用以測試和積累數(shù)據(jù),。此外,,我們還在蕪湖交警支隊的支持下,在中心城區(qū)路口建設(shè)了V2X基礎(chǔ)設(shè)施,。之后,,我們還和很多的企業(yè)和測試場開展更多的合作,在實際的項目中進行測試,。 |
|