病毒|我們需要將人工智能與人類大腦和偏見脫鉤( 二 ) 算法|機器學習|護士|網絡安全

當數據是王者時
幸運的是，還有另一種解決方案可以拋開人造標簽，只處理至少在某種程度上客觀的數據。在COVID預測器的例子中，消除人造COVID/無COVID標簽可能是有意義的。首先，由于人為錯誤，數據可能是錯誤的。另一個主要問題是數據可能不完整。社會經濟地位較低的人獲得診斷資源的機會往往較少，這意味著他們可能已經感染了新冠病毒，但從未檢測呈陽性。這種缺失可能會使數據集傾斜。
因此，為了使結果對保險公司或疫苗供應商來說更可靠，消除標簽可能是有用的。現在，一個不受監督的機器學習模型將進行集群，例如按郵政編碼或個人職業進行集群。這樣，一個人可以得到幾個不同的組。然后，模型可以輕松地為其中一個組分配一個新條目。之后，您可以將這些分組數據與其他更可靠的數據相匹配，如地理區域或專業內的超額死亡率。這樣，人們就有可能知道某人是否感染了新冠病毒，無論有些人可能比其他人更容易獲得檢測。
當然，這仍然需要一些手工工作，因為數據科學家需要將分組數據與超額死亡率數據匹配起來。盡管如此，對保險公司或疫苗供應商來說，結果可能要可靠得多。
送機器去賞金狩獵
同樣，這一切都很好，但你仍然把固定疫苗數據或保險單留給過程另一端的人。就疫苗而言，負責人可能會決定稍后為有色人種接種疫苗，因為他們往往較少使用醫療保健系統，從而降低醫院生病時超車的可能性。不用說，這將是一項基于種族主義假設的不公平政策。
讓決策權由機器決定可以幫助規避決策者根深蒂固的偏見。這是強化學習背后的概念。您提供的數據集與以前相同，沒有人造標簽，因為它們可能會扭曲結果。您還向它提供了一些關于保險單或疫苗如何工作的信息。最后，您選擇幾個關鍵目標，如不過度使用醫院資源、社會公平等。
在強化學習中，如果機器找到符合關鍵目標的保險單或疫苗日期，它將獲得獎勵。通過對數據集的培訓，它找到了優化這些目標的政策或疫苗日期。
這一進程進一步消除了人工數據輸入或決策的必要性。雖然它仍然遠非完美，但這種模式不僅可以更快、更容易地做出重要決定，還可以更公平、更自由地擺脫人類偏見。

進一步減少人類偏見
任何數據科學家都會告訴你，并非所有機器學習模型——無論是監督的、非監督的還是強化的——都非常適合每個問題。例如，保險公司可能希望獲得一個人是否感染了新冠病毒的概率，但希望自己制定保單。這改變了問題，使強化學習變得不合適。
幸運的是，即使對模型的選擇有限，也有幾種常見的做法在很大程度上有助于實現公正的結果。這些大多根植于數據集。
首先，當您有理由懷疑特定數據點可能受到現有不平等的不當影響時，盲目不可靠的數據是明智的。例如，由于我們知道COVID/無COVID標簽可能出于各種原因不準確，將其排除在外可能會導致更準確的結果。
然而，這種策略不應該與令人眼花繚亂的敏感數據相混淆。例如，人們可以選擇盲目種族數據，以避免歧視。然而，這可能弊大于利，因為機器可能會學習一些郵政編碼和保險單的知識。在許多情況下，郵政編碼與種族密切相關。結果是，一名來自紐約的拉丁裔護士和一名來自俄亥俄州的白人護士，他們擁有原本相同的數據，最終可能會獲得不同的保險單，這最終可能會不公平。

病毒|我們需要將人工智能與人類大腦和偏見脫鉤( 二 )

相關經驗推薦

冬蟲夏草的用處和功效冬蟲夏草的作用和用途

衣柜放什么防蟑螂

黑美人西瓜產地哪里最好黑美人西瓜產地

名爵gt空調濾芯在哪里

OMG危險了！Doinb扎心點評：小奶油英雄池有問題，季后賽要一輪游

誰最“賢惠”？余霜、希然、瞳夕齊曬飯菜，這次是她輸得徹底

吃番石榴有什么好處？孕婦吃番石榴有什么好處？

游戲圈最難成就，完成條件無人知曉，把游戲打通關都不行？

網面運動鞋清洗小竅門網面運動鞋清洗小竅門加白醋

2.4米寬的車位能停多寬的車呢 2.4米寬的車位能停多寬的車

旋風讀音旋風讀音是二聲還是四聲

《地下城與勇士：決斗》IGN8分:格斗游戲新手亦可暢玩

烈烈|非人哉又出現一個“沒臉見人”的新角色！之前的嫦娥也從不露臉

去屑洗發露去屑洗發露推薦

2023蘇州園林春節門票多少錢

DNF雜談：蹭活動1級buff，奶大祭司換ceo提升小測

早餐餡餅的做法大全早餐餡餅的做法

過年給長輩的祝福語押韻?

蝴蝶蘭葉子發黃還能緩過來嗎

怎么開光開光的方法介紹