當數據是王者時
幸運的是 , 還有另一種解決方案可以拋開人造標簽 , 只處理至少在某種程度上客觀的數據 。 在COVID預測器的例子中 , 消除人造COVID/無COVID標簽可能是有意義的 。 首先 , 由于人為錯誤 , 數據可能是錯誤的 。 另一個主要問題是數據可能不完整 。 社會經濟地位較低的人獲得診斷資源的機會往往較少 , 這意味著他們可能已經感染了新冠病毒 , 但從未檢測呈陽性 。 這種缺失可能會使數據集傾斜 。
因此 , 為了使結果對保險公司或疫苗供應商來說更可靠 , 消除標簽可能是有用的 。 現在 , 一個不受監督的機器學習模型將進行集群 , 例如按郵政編碼或個人職業進行集群 。 這樣 , 一個人可以得到幾個不同的組 。 然后 , 模型可以輕松地為其中一個組分配一個新條目 。 之后 , 您可以將這些分組數據與其他更可靠的數據相匹配 , 如地理區域或專業內的超額死亡率 。 這樣 , 人們就有可能知道某人是否感染了新冠病毒 , 無論有些人可能比其他人更容易獲得檢測 。
當然 , 這仍然需要一些手工工作 , 因為數據科學家需要將分組數據與超額死亡率數據匹配起來 。 盡管如此 , 對保險公司或疫苗供應商來說 , 結果可能要可靠得多 。
送機器去賞金狩獵
同樣 , 這一切都很好 , 但你仍然把固定疫苗數據或保險單留給過程另一端的人 。 就疫苗而言 , 負責人可能會決定稍后為有色人種接種疫苗 , 因為他們往往較少使用醫療保健系統 , 從而降低醫院生病時超車的可能性 。 不用說 , 這將是一項基于種族主義假設的不公平政策 。
讓決策權由機器決定可以幫助規避決策者根深蒂固的偏見 。 這是強化學習背后的概念 。 您提供的數據集與以前相同 , 沒有人造標簽 , 因為它們可能會扭曲結果 。 您還向它提供了一些關于保險單或疫苗如何工作的信息 。 最后 , 您選擇幾個關鍵目標 , 如不過度使用醫院資源、社會公平等 。
在強化學習中 , 如果機器找到符合關鍵目標的保險單或疫苗日期 , 它將獲得獎勵 。 通過對數據集的培訓 , 它找到了優化這些目標的政策或疫苗日期 。
這一進程進一步消除了人工數據輸入或決策的必要性 。 雖然它仍然遠非完美 , 但這種模式不僅可以更快、更容易地做出重要決定 , 還可以更公平、更自由地擺脫人類偏見 。
進一步減少人類偏見
任何數據科學家都會告訴你 , 并非所有機器學習模型——無論是監督的、非監督的還是強化的——都非常適合每個問題 。 例如 , 保險公司可能希望獲得一個人是否感染了新冠病毒的概率 , 但希望自己制定保單 。 這改變了問題 , 使強化學習變得不合適 。
幸運的是 , 即使對模型的選擇有限 , 也有幾種常見的做法在很大程度上有助于實現公正的結果 。 這些大多根植于數據集 。
首先 , 當您有理由懷疑特定數據點可能受到現有不平等的不當影響時 , 盲目不可靠的數據是明智的 。 例如 , 由于我們知道COVID/無COVID標簽可能出于各種原因不準確 , 將其排除在外可能會導致更準確的結果 。
然而 , 這種策略不應該與令人眼花繚亂的敏感數據相混淆 。 例如 , 人們可以選擇盲目種族數據 , 以避免歧視 。 然而 , 這可能弊大于利 , 因為機器可能會學習一些郵政編碼和保險單的知識 。 在許多情況下 , 郵政編碼與種族密切相關 。 結果是 , 一名來自紐約的拉丁裔護士和一名來自俄亥俄州的白人護士 , 他們擁有原本相同的數據 , 最終可能會獲得不同的保險單 , 這最終可能會不公平 。
相關經驗推薦
- 微信|微信用戶需了解,若手機出現“4種情況”,請盡快將手機關機
- |最便宜 iPhone 開售,只需 2035
- 一加科技|手機出現“新騙術”?無需本人就能轉走存款,請注意保管好財物
- 微信|QQ 8.8.68版已正式發布:不是它變了,是我們已不是目標人群!
- |電腦無法在真空中運行
- 筆記本|讓Win妙變mac!無需黑蘋果,用這個軟件就搞定
- 蘋果|華碩RT-AX86U巨齒鯊聯名款上新僅需1999元
- iPhone|新iPhone到手后都需要做什么?趕緊收藏
- 英特爾|顯卡太難買,游戲媒體向Intel求救!Intel表示:我們盡力而為
- 特斯拉|特斯拉ModelPi,是否能顛覆蘋果,讓我們拭目以待
