2017年7月25日 星期二

欺騙人工智慧與交易

我曾和耐克下面的一家店鋪吵了一架,在網上持續不斷的口水戰,對方的營業員和管理人員居然也參與這場爭吵。 那篇微博的點擊率達到了三十多萬點擊率。
後遺症是在後面的一兩年裡,我閱讀的頁面上根據大資料監控出現的廣告,大量的鞋類廣告。
在我的頁面上經常出現的,除了鞋類,還有黃金交易平臺廣告。 我幫妻子和女兒下訂單,訂過一次女鞋後,又經常出現女鞋類廣告。
再有一題,我們群裡開一個惡俗的玩笑,說要眾籌一個性愛機器人的公司,話題扯得沒邊沒沿,去搜索研究了一下現在賣的娃娃後,你可想而知,會出現什麼廣告。
這讓我大感有趣,所以我在不同的網頁平臺做了個嘗試,我去幾個網商平臺,搜索了大量男女商品,毫無規律的選擇。 在百度等搜索網站,搜索大量不同的話題。 持續了一兩周。
結果發現廣告亂了,大資料開始搞不清楚機主的男女性別,也搞不清楚消費傾向和行為模式。
我是有點吃飽了撐得? 哈哈哈,有點。
這是個粗劣的遊戲,因為大資料推薦廣告的演算法非常普通,它只是記錄你的行為軌跡,得出一定統計結果而已。
在交易的技術分析裡,也經常用資料統計,比如k線圖的形態,或蠟燭圖的形態,去總結下一步走勢概率,得出策略。 以前出現的程式化交易,很多是人工估計概率後做出策略模型,讓程式去執行,然後根據不同的環境變化,人工在做調整。
以至於後來出現打擊程式化的交易,在日內,大資金行為可以干預短期交易。 而程式化無法驅動大資金,所以會被蓄意打止損的人工交易員打敗。
後來就出現高頻交易,它是測算每次交易的勝率和盈虧比,從而得出交易策略。
結果我們可以看到阿爾法狗的演變過程中,全部演繹了程式化交易和高頻交易的行為模式。
前不久,阿爾法狗在圍棋三番戰中幹掉了柯潔。
在過去深藍戰勝國際象棋大師後,看懂了機器程式運算規則的人們以為圍棋是不可戰勝的,因為圍棋的分支因數太多,以至於整個宇宙的原子都無法窮盡圍棋的全部走勢。
但阿爾法狗不是深藍的套路,它使用了三招結合,蒙特卡洛搜尋樹、深度學習、自我進化。 簡單的說,蒙特卡洛搜尋樹是一種隨機演算法,俗稱倆傻逼扔骰子,在圍棋盤上隨意的扔骰子,自我對弈,從而記錄和產生各種隨機走勢下的贏法。 之後,結合人的走法,也就是圍棋職業選手的下棋模式,做深度學習。 這其實是人類棋手的學習模式,從古老演變到現在的所有定式和走法,記憶和訓練。 不好意思,機器人比你學得快,記得住。 唯一的缺陷是思索過慢,所以後來阿爾法狗的工程師改進了Phuman演算法,並用分散式多cpu來處理,增強速度。 自我進化指的是評價函數,也就是評估每一個走法策略後面的勝率。
圍棋高手所比的其實就是未來幾步棋、十幾步棋的選擇和最有對策。 不好意思,機器比你計算的快和概率高,它還比你冷靜,你有情緒。
所以,在與機器人下棋的過程中,如何使用欺騙? 人類棋手用的是情緒和心理,比如撲克牌比賽裡的裝腔作勢,言語和人體行為恐嚇欺騙。
機器上,你要給它設陷阱,除非你是上帝模式開啟,已經把圍棋窮宇宙原子無法算盡的模式都在腦袋中,你給機器人一個陷阱,它從沒看到過這種模式,只好隨機扔骰子。
人類監控的機器體系,只是簡單的基於演算法,研究統計你的行為模式,通過IP位址、出行的方式和規律,計算你的整個行為模式,看是否損害整個體系。 而真正心存不軌的人和組織,會通過各種掩蓋和行為規則亂化,來欺騙這種監控。 當然對於網路行為,中國九億上網的線民資訊和行為模式,都在大資料系統裡,全世界其他地方也是。 極少數的匿名者,應用深網等各種加密技術,躲避大資料搜索監控。
但對於遊戲類博弈的人工智慧走的是另外一種模式。
交易上已經大量使用機器人,中高頻程式化是現在的交易模式選擇。
世界各國的期交所其實歡迎中高頻交易,因為會帶來手續費,但各國政府都對此非常頭大,因為會等於利用不對稱力量欺詐中小投資人。 政府極力想要維持生態平衡,以免不公平交易損害大多數人的利益。 所以前不久美國一家交易所已經開始使用遲滯高頻交易下單的方式阻礙高頻交易。
本質上高頻交易用的是阿爾法狗裡面評價函數模型,計算大量下單後的損益,以及利用速度優勢截殺其他投資人的交易單。
這種模式,是監管層和中小投資人極度痛恨的。
但未來的人工智慧交易員並不是這樣簡單的利用力量不平衡來欺詐散戶,而是通過深度學習和自我進化,得出交易策略來執行。
這些正是人類金融分析師和交易員所做的,而機器比人類交易員更可怕的地方,是它沒有情感,恐懼和貪婪對它來說是個空洞,不存在。
我很感興趣的不是這個機器人戰勝人類交易員的過程,而是未來所有的人類交易員都消失,大家都交給機器人,那金融市場就好玩了,成了死水一潭。
在所有的機器理性思維下,絕對的理性思維,市場的波動終於消失。
烏托邦實現了。

沒有留言 :

張貼留言