婚外情調(diào)查,如何不被暴打?

眾所周知, 我有很多醫(yī)生朋友. 他們經(jīng)常需要做一些敏感問題的調(diào)查, 比如"你是否有婚外情"或者"你是否是個彎彎". 不要問為什么, 問就是為了寫論文.



這些敏感問題的肯定回答會讓被調(diào)查者非常難堪, 從而導(dǎo)致他們拒絕或者不誠實地回答問題. 事實上, 在發(fā)出問卷調(diào)查時, 我的醫(yī)生朋友非常擔心被打爆狗頭.


image

隨機化回答技術(shù)

在跟我學(xué)過統(tǒng)計學(xué)的老婆聊這個問題的時候, 她說可以用采用隨機化回答技術(shù)解決這個問題.

所謂的隨機化回答技術(shù), 就是指在調(diào)查中使用特定的隨機裝置, 使調(diào)查者以預(yù)定的概率回答問題. 這一技術(shù)可以最大限度的保護被調(diào)查者的隱私, 從而取得被調(diào)查者的信任. 舉個簡單的例子, 比如調(diào)查某地婚外情的比例時, 可以給被調(diào)查者一個硬幣, 讓他避開調(diào)查人員自己拋硬幣, 正面向上則回答問題"你是否有過婚外情?", 反面向上則回答"你的生日是否在 7 月 1 日以前?". 因為調(diào)查人員不知道回答的是哪個問題, 所以可以更容易的取得被調(diào)查者的信任.

我們這里主要介紹兩種最簡單的隨機化回答技術(shù), 即沃納模型西蒙斯模型.

沃納模型

沃納模型是由 Warner 在 1965 年提出的, 該模型向被調(diào)查者提問兩個與敏感性特征相關(guān)但結(jié)果完全相反的問題. 假定我們想調(diào)查"有過婚外情行為"的人所占的比例 \pi, 則可以設(shè)計下面兩個問題:

  • 問題1:你是否有過婚外情行為.
  • 問題2:你是否從沒有過婚外情行為.

同時, 調(diào)查者準備一副牌作為隨機裝置, 這副牌中中有比例 p 的牌標有數(shù)字 1, 其余比例為 1-p 的牌標有數(shù)字 2, 除此以外, 牌沒有其它的區(qū)別. 對 n 個被調(diào)查者中的每一個人重復(fù)以下過程: 被調(diào)查者從洗好的整副牌中隨便地選取一張, 記下牌上的數(shù)字, 數(shù)字不要讓調(diào)查人員者看見. 如果被調(diào)查者抽到的牌標有數(shù)字 1, 他用"是"或"不是"回答問題 1;如果抽到的牌標有數(shù)字 2, 則回答問題 2. 調(diào)查者只能獲得"是"和"不是"的答案, 并不知道被調(diào)查者回答的是哪個問題. 然而, 即使只知道"是"的回答數(shù), 調(diào)查人員也能估計出\pi來. 為了方便, 我們引進下面的記號:

用全概率公式, 我們可以寫出訪問者得到回答"是"的概率:

\small \begin{split} P(B)&= P(A\cap B)+ P(\bar{A}\cap B)\\ &= P(A)P(B∣A)+ P(\bar{A})P(B∣\bar{A}) \end{split}

使用用表格里的記號, 可以得到等式:

\lambda = p\pi+(1-p)(1-\pi)

假設(shè)總共有m個人回答"是", 并用m/n近似\lambda, 可以很容易地得到\pi的估計值

\hat{\pi} = \frac{1}{2p-1}(p-1+\frac{m}{n}),\ p\neq \frac12.

西蒙斯模型

在沃納模型中, 兩個問題都涉及到了敏感問題, 仍然可能會引起人們的戒備. Simmons
改進了沃納模型, 提出了西蒙斯模型(也被稱為不相關(guān)問題模型). 該模型的基本思想是:向被調(diào)查者提出一個無關(guān)緊要的問題, 被調(diào)查者可能在感情上會覺得更安全, 因為作出回答時不能向訪問者泄漏更多的信息. 即在"匿名狀態(tài)"的情況下, 使用兩個互不相關(guān)的問題, 一個與敏感問題相關(guān), 另一個是非敏感問題, 調(diào)查人員會得到更多的信任. 在西蒙斯模型中, 被調(diào)查者隨機地選取下列問題中的一個回答:

  • 問題 1:你是否有過婚外情行為?
  • 問題 2:你的生日是在7月1日以前嗎?

其中問題 2 也可以換為其它非敏感問題, 只要概率 \pi_2 是已知的即可, 比如

  • 問題 2a:你是8月份出生的么?
  • 問題 2b:你的身份證最后一位是奇數(shù)么?

與沃納模型一樣, 調(diào)查者需要準備一隨機裝置, 每個調(diào)查者都根據(jù)隨機試驗的結(jié)果回答相應(yīng)的問題. 調(diào)查者僅能得到"是"與"不是"的答案, 但卻能夠用這些數(shù)據(jù)估計出\pi來.
為了說明這一點, 我們引入下列符號:


根據(jù)全概率公式, 我們可以得到:

\small \begin{split} P(B)&= P(A\cap B)+ P(\bar{A}\cap B)\\ & = P(A) P(B∣A)+ P(\bar{A})P(B∣ \bar{A}) \end{split}

使用表格里的符號,可以得到等式:

\lambda= p\pi+(1-p)\pi_2

假設(shè)總共有m個人回答結(jié)果為"是", 并用m/n近似\lambda, 就可以得到\pi的估計值

\hat{\pi}=\frac{1}{p}[(p-1)\pi_2+\frac{m}{n}],\ \pi_2>0.

隨機化回答法技術(shù)的使用

抽樣調(diào)查的策劃工作包括一些不同的環(huán)節(jié). 這些環(huán)節(jié)包括調(diào)查的準備、調(diào)查的實施、數(shù)據(jù)收集和最后的解釋數(shù)據(jù). 除了問題的設(shè)計之外, 耐心地給被調(diào)查者解釋也是至關(guān)重要的. 被調(diào)查者了解無人知道他回答的哪個問題后, 對敏感性調(diào)查的抵觸會更低.

此外, 隨機裝置應(yīng)盡可能簡單. 在試驗開始前應(yīng)允許被問者檢查該裝置. 檢查具有雙重目的:一是使被問者相信裝置里沒有做手腳, 二是使被問者明白怎樣使用該裝置.

歡迎關(guān)注公眾號:數(shù)學(xué)知識派

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 一大早,群里姐妹們都在互道感恩,感謝彼此的陪伴,這樣美好的時光。我也在這樣溫暖的氛圍里,一路北上,長途跋涉在去公司...
    茉莉大大閱讀 195評論 0 0
  • 一個人真的會改變一個人,一個人也真的會因為一個人而改變。 五年前,因為喜歡,看著愛看書的C漸漸受了他的影響,從慢慢...
    箜蒔閱讀 390評論 0 0
  • (新韻,十一庚) 奇馬南來不北行,萊州灣畔徘徊中。 夏秋之際連綿雨,始信山東屬華東。
    木卯山閱讀 544評論 2 8

友情鏈接更多精彩內(nèi)容