眾所周知, 我有很多醫(yī)生朋友. 他們經(jīng)常需要做一些敏感問題的調(diào)查, 比如"你是否有婚外情"或者"你是否是個彎彎". 不要問為什么, 問就是為了寫論文.

這些敏感問題的肯定回答會讓被調(diào)查者非常難堪, 從而導(dǎo)致他們拒絕或者不誠實地回答問題. 事實上, 在發(fā)出問卷調(diào)查時, 我的醫(yī)生朋友非常擔心被打爆狗頭.

隨機化回答技術(shù)
在跟我學(xué)過統(tǒng)計學(xué)的老婆聊這個問題的時候, 她說可以用采用隨機化回答技術(shù)解決這個問題.

所謂的隨機化回答技術(shù), 就是指在調(diào)查中使用特定的隨機裝置, 使調(diào)查者以預(yù)定的概率回答問題. 這一技術(shù)可以最大限度的保護被調(diào)查者的隱私, 從而取得被調(diào)查者的信任. 舉個簡單的例子, 比如調(diào)查某地婚外情的比例時, 可以給被調(diào)查者一個硬幣, 讓他避開調(diào)查人員自己拋硬幣, 正面向上則回答問題"你是否有過婚外情?", 反面向上則回答"你的生日是否在 7 月 1 日以前?". 因為調(diào)查人員不知道回答的是哪個問題, 所以可以更容易的取得被調(diào)查者的信任.
我們這里主要介紹兩種最簡單的隨機化回答技術(shù), 即沃納模型和西蒙斯模型.
沃納模型
沃納模型是由 Warner 在 1965 年提出的, 該模型向被調(diào)查者提問兩個與敏感性特征相關(guān)但結(jié)果完全相反的問題. 假定我們想調(diào)查"有過婚外情行為"的人所占的比例 , 則可以設(shè)計下面兩個問題:
- 問題1:你是否有過婚外情行為.
- 問題2:你是否從沒有過婚外情行為.
同時, 調(diào)查者準備一副牌作為隨機裝置, 這副牌中中有比例 的牌標有數(shù)字
, 其余比例為
的牌標有數(shù)字
, 除此以外, 牌沒有其它的區(qū)別. 對
個被調(diào)查者中的每一個人重復(fù)以下過程: 被調(diào)查者從洗好的整副牌中隨便地選取一張, 記下牌上的數(shù)字, 數(shù)字不要讓調(diào)查人員者看見. 如果被調(diào)查者抽到的牌標有數(shù)字
, 他用"是"或"不是"回答問題 1;如果抽到的牌標有數(shù)字
, 則回答問題 2. 調(diào)查者只能獲得"是"和"不是"的答案, 并不知道被調(diào)查者回答的是哪個問題. 然而, 即使只知道"是"的回答數(shù), 調(diào)查人員也能估計出
來. 為了方便, 我們引進下面的記號:

用全概率公式, 我們可以寫出訪問者得到回答"是"的概率:
使用用表格里的記號, 可以得到等式:
假設(shè)總共有個人回答"是", 并用
近似
, 可以很容易地得到
的估計值
西蒙斯模型
在沃納模型中, 兩個問題都涉及到了敏感問題, 仍然可能會引起人們的戒備. Simmons
改進了沃納模型, 提出了西蒙斯模型(也被稱為不相關(guān)問題模型). 該模型的基本思想是:向被調(diào)查者提出一個無關(guān)緊要的問題, 被調(diào)查者可能在感情上會覺得更安全, 因為作出回答時不能向訪問者泄漏更多的信息. 即在"匿名狀態(tài)"的情況下, 使用兩個互不相關(guān)的問題, 一個與敏感問題相關(guān), 另一個是非敏感問題, 調(diào)查人員會得到更多的信任. 在西蒙斯模型中, 被調(diào)查者隨機地選取下列問題中的一個回答:
- 問題 1:你是否有過婚外情行為?
- 問題 2:你的生日是在7月1日以前嗎?
其中問題 2 也可以換為其它非敏感問題, 只要概率 是已知的即可, 比如
- 問題 2a:你是8月份出生的么?
- 問題 2b:你的身份證最后一位是奇數(shù)么?
與沃納模型一樣, 調(diào)查者需要準備一隨機裝置, 每個調(diào)查者都根據(jù)隨機試驗的結(jié)果回答相應(yīng)的問題. 調(diào)查者僅能得到"是"與"不是"的答案, 但卻能夠用這些數(shù)據(jù)估計出來.
為了說明這一點, 我們引入下列符號:

根據(jù)全概率公式, 我們可以得到:
使用表格里的符號,可以得到等式:
假設(shè)總共有個人回答結(jié)果為"是", 并用
近似
, 就可以得到
的估計值

隨機化回答法技術(shù)的使用
抽樣調(diào)查的策劃工作包括一些不同的環(huán)節(jié). 這些環(huán)節(jié)包括調(diào)查的準備、調(diào)查的實施、數(shù)據(jù)收集和最后的解釋數(shù)據(jù). 除了問題的設(shè)計之外, 耐心地給被調(diào)查者解釋也是至關(guān)重要的. 被調(diào)查者了解無人知道他回答的哪個問題后, 對敏感性調(diào)查的抵觸會更低.
此外, 隨機裝置應(yīng)盡可能簡單. 在試驗開始前應(yīng)允許被問者檢查該裝置. 檢查具有雙重目的:一是使被問者相信裝置里沒有做手腳, 二是使被問者明白怎樣使用該裝置.
歡迎關(guān)注公眾號:數(shù)學(xué)知識派