時間和經(jīng)費有限的研究人員,如何做出原創(chuàng)性的實證貢獻?答案可能就在你每天閱讀的文件里。
你有沒有想過,那些你每天翻閱的國際法律公約、政府政策文件、媒體報道、甚至社交媒體帖子,都可以成為你研究的“數(shù)據(jù)”?
對于學習國際性問題的學生來說,我們常常被“數(shù)據(jù)收集”這件事困擾——田野調(diào)查需要時間和經(jīng)費,訪談需要接觸受訪者,問卷調(diào)查需要大量分發(fā)...但其實,最有價值的數(shù)據(jù)庫可能就在你的書桌上。
聯(lián)合國難民署的報告、安理會的決議、非政府組織的宣傳材料——這些文本不僅唾手可得,還能為你的研究提供原創(chuàng)性的實證貢獻。
今天,我們就來拆解《跨越邊界的研究》第11章的核心內(nèi)容,看看如何系統(tǒng)化地分析和利用這些文本數(shù)據(jù)。
書名:《跨越邊界的研究》
作者:【加】克里斯蒂娜·克拉克-卡扎克
一個真實的研究案例: 聯(lián)合國難民署的十年報告分析
先來看一個元示例,感受一下文本分析的魅力。
研究人員分析了聯(lián)合國難民署(UNHCR)十年間的報告和呼吁文件,想了解不同年齡群體在這些籌款和項目文件中是如何被呈現(xiàn)的。他們問了兩個問題:
與難民中的實際人口比例相比,兒童在聯(lián)合國難民署的話語表述中是否有不成比例的呈現(xiàn)?
從難民的具體處境出發(fā),不同生命周期階段的社會建構(gòu)意義和角色是什么?
為了回答這些問題,研究人員采用了定量+定性的混合方法:
定量分析:對文件中的照片進行編碼,按照嬰兒、兒童、青少年、成人和老年人五個類別,記錄每個年齡類別是否出現(xiàn)在照片中,是作為“主要主題”還是“次要主題”。同時,他們對文件中提及特定年齡段的文本進行了內(nèi)容分析,統(tǒng)計出現(xiàn)的頻次。
結(jié)果很有意思:成人出現(xiàn)在最多數(shù)量的照片中,但文本中兒童(尤其是女孩)被提及的頻次遠高于成人。
定性分析:研究人員逐字轉(zhuǎn)錄了照片的說明文字,記錄了照片中的其他文本信息(如橫幅或T恤上的文字),分析照片的內(nèi)涵意義。他們將內(nèi)容歸納為十個主題,進一步編碼分析。
結(jié)果發(fā)現(xiàn):兒童主要在視覺和文本上被與“脆弱性”及保護、教育和健康聯(lián)系起來。更有趣的是,文本和照片之間存在矛盾——文本中把童工作為負面問題來討論,但有幾張照片卻展示了參與工作的兒童。
這個案例告訴我們幾個重要道理:
? 多種定量和定性方法可以結(jié)合使用
? 代碼、編碼和編碼者的一致性至關(guān)重要
? 圖像也是重要的數(shù)據(jù)來源
? 文本分析可以揭示特定群體被代表的方式中存在的偏見
去哪里獲取文件? 五個渠道要知道 1. 圖書館
公共和私人圖書館里藏著大量無法在線獲取的一手文件。有時候,親自去圖書館“瀏覽”相關(guān)文件附近的藏書,可能會給你帶來新的研究視角。
2. 檔案館
政府、國際組織、博物館和一些私人組織都設有檔案庫。這些檔案可能是數(shù)字格式的,也可能是實體的。
??注意:訪問檔案往往需要提前申請,了解限制條件。另外要記住,檔案館和博物館常常是殖民化和國族建設項目的一部分,它們可能只呈現(xiàn)了事件的部分樣貌。
3. 信息公開申請
在一些民主國家或民主轉(zhuǎn)型國家,某些政府文件只能通過提交信息獲取申請的方式獲得。這通常需要特定的程序、特定的理由,有時還要支付費用。
小貼士:如果文件包含敏感信息,部分內(nèi)容可能會被刪除。申請需要時間處理,務必把這個時間成本納入研究設計。
4. 個人的文件副本
地圖、信件、日記、會議記錄等個人文件,通常需要通過建立個人關(guān)系來獲取。這可以作為訪談過程或民族志方法的一部分。
5. 社交媒體
一些社交媒體數(shù)據(jù)是公開的,也有一些是半公開或私有的。一旦獲得倫理批準和所需同意,社交媒體信息可以提供豐富的文本和視覺數(shù)據(jù),而且?guī)缀醪换ń?jīng)費。
??挑戰(zhàn):數(shù)據(jù)量可能難以管理,數(shù)據(jù)質(zhì)量差異也很大。
代碼和編碼: 把混亂的文本變得有條理
分析文本的本質(zhì)是:識別含義 → 歸類為主題 → 分配代碼。
需要區(qū)分的兩種含義:
?指稱性含義:字面、顯性或直接的含義
?內(nèi)涵性含義:由推斷或暗示得來的含義
三種類型的代碼:
保護信息的代碼:如用代碼人名保護受訪者身份
操作代碼:組織和分類信息,如用“METH”表示方法論相關(guān)信息
主題代碼:幫助分析數(shù)據(jù)的索引工具,如“脆弱性”
有些主題代碼已經(jīng)被標準化,比如《文化項目分類》提供了數(shù)字代碼,幫助標準化編碼民族志數(shù)據(jù)。這對于跨越不同案例的比較研究非常有用。
開發(fā)代碼手冊的關(guān)鍵原則:
?類別要全面:預見所有可能的類別
?類別要互斥:編碼者清楚如何對模糊主題進行編碼
?定期校準:當多人使用同一套代碼時,定期讓每個人對相同文本進行編碼,確保編碼員間信度
編碼可以手動,也可以用軟件:
?字典方法:提供單詞或短語列表,讓軟件在文本中“搜索”
?監(jiān)督式機器學習:手動編碼一組“學習文件”,訓練計算機以類似方式編碼
?無監(jiān)督機器學習:完全自動化,計算機生成類別并分類文本
三種文本分析方法 1. 內(nèi)容分析:演繹法
從預先設定的問題或假設出發(fā),將之前開發(fā)的代碼應用于文本。
步驟:
制定假設或研究問題
創(chuàng)建主題代碼代表關(guān)鍵變量
將代碼應用于文本(定量計算頻次,定性搜索數(shù)據(jù)支持或反駁假設)
根據(jù)發(fā)現(xiàn)重新制定或完善假設
案例:普爾克特等人分析了31家全球超市連鎖店的企業(yè)社會責任報告,研究他們在公共衛(wèi)生方面做出了哪些承諾。通過分析79個主題,發(fā)現(xiàn)大多數(shù)主題與公共衛(wèi)生營養(yǎng)有關(guān),其次是食品治理和食品系統(tǒng)。
2. 扎根理論:歸納法
沒有預先設定的主題或代碼,主題在與文本互動過程中浮現(xiàn)。
步驟:
①多次閱讀文本,了解浮現(xiàn)的主題
②根據(jù)這些主題開發(fā)代碼
③將相同類別的數(shù)據(jù)進行比較,看它們?nèi)绾温?lián)系
④利用這些聯(lián)系構(gòu)建理論
⑤辨識文本和引用的例子支持理論
案例:研究人員用扎根理論理解毛利人女性在不安全關(guān)系中的自我保護策略。他們通過訪談、焦點小組、媒體報道、傳統(tǒng)故事等多種數(shù)據(jù),采用原住民集體路徑,通過協(xié)作式小組討論,就數(shù)據(jù)和出現(xiàn)的代碼達成共識。
3. 批判話語分析:關(guān)注權(quán)力關(guān)系
側(cè)重于探討權(quán)力如何通過話語構(gòu)建,并經(jīng)由話語傳達。
步驟:
① 選擇研究主題:提出可以通過分析符號學元素與其他元素辯證關(guān)系來回答的問題,了解過往話語的“譜系”
② 選擇并分析文本:描述文本如何被創(chuàng)建,從單詞、短語、文本內(nèi)部關(guān)系、主題優(yōu)先級等層面分析
③ 考慮社會秩序:改變社會秩序是否必要
④ 確定可能的符號學解決方案:用話語、敘述和論證找到克服障礙的方法
案例:卡明斯等人分析聯(lián)合國《2030年可持續(xù)發(fā)展議程》中的話語,發(fā)現(xiàn)“技術(shù)-科學-經(jīng)濟話語”是實施和目標層面的主導話語,而在愿景和策略層面則有一些多元參與話語的證據(jù)。
解讀圖像: 不只是“看圖說話”
照片往往被視為“事實”的客觀表現(xiàn),但其實照片的“真實價值”很曖昧:
? 照片內(nèi)容可以通過技術(shù)手段修改
? 呈現(xiàn)什么取決于攝影師的選擇
? 選用哪張照片取決于編輯的決定
? 照片需要放在文本語境中闡釋
在分析圖像時,要承認研究人員的立場性。正如南迪塔·多格拉所說:“‘閱讀’或解碼任何給定圖像的過程,通常是基于人們的身份和生活經(jīng)驗而以不同方式進行的。”
這也是為什么通過參與式方法生成的視覺數(shù)據(jù),應該讓參與者自己解釋和說明情境信息。
案例:“流離”項目讓“加萊叢林”的難民參與攝影,他們接受培訓,獲得相機,擁有自己拍攝圖像的版權(quán),有權(quán)編輯圖像,決定如何闡釋和展示照片。參與者給自己的照片添加標題,英文標題是從他們選擇的語言翻譯而來。
跨邊界的反思: 誰在表現(xiàn)誰?
文本和視覺分析的一個重要貢獻是揭露主流話語和文件中的偏見。
在關(guān)注全球不平等的國際性項目中,研究人員經(jīng)常涉及“關(guān)注他人的痛苦”。我們有責任反思性地思考自己在這些表現(xiàn)的(再)生產(chǎn)和消費中的立場性。
正如馬謝爾·拉默斯所說:“話語分析路徑不僅為我們提供了‘他者’‘如何’被表現(xiàn)的見解,還有‘由誰’和出于‘什么原因’而表現(xiàn)的見解。”
沖突、流離失所和貧窮這樣的現(xiàn)象存在多個面向,人們在這些情境中有一系列的生活經(jīng)歷。研究人員要做的,是通過視覺和文本表達反映這種復雜性。
文字和圖像非常重要。在跨邊界、跨文化的研究中,對于文字和圖像的表現(xiàn)尤為重要。
文件是豐富的文本和視覺數(shù)據(jù)來源。隨著通信技術(shù)的發(fā)展,研究人員可以更容易地獲取許多文本,即便在時間和資源有限的情況下也能做出知識貢獻。
無法在線上獲取的文件需要更多努力去尋找和獲取,但它們可能會對知識作出更大的貢獻,或是針對對外公開但不易獲得的政策提出更深刻的見解。
你的研究對象,可能就在你每天閱讀的文件里。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.