關於python的論文 - 考試題庫

　　Python是一門簡單,實用而且有趣的百搭款語言,在Web應用開發,系統網絡運維,科學與數字計算,網絡編程等領域都有所建樹.在計算機語言中Python發展速度不可小覷,可以說是最適合零基礎人士入門學習的計算機語言之一。本文是搜索整理的關於python的論文6篇，供大家借鑑參考。
　　關於python的論文第一篇：Python在建立住院次均費用報表中的應用
　　摘要：為了解決基於Python建立住院次均費用報表的精細化處理，提高日常統計工作效率，通過介紹Python的功能，展現其在數據核對、數據處理、數據導出中的應用。結果表明，Python可解決住院次均費用導出後需多次整理的問題。由此得出，使用Python分析數據和導出數據，可有效提高統計工作效率。
　　關鍵詞: Python, 住院次均費用:統計報表
　　隨著大數據的發展，醫院管理層對數據的需求增加，醫院統計工作面臨新的挑戰。統計人員為了能及時完成統計任務，需要增強自身統計業務能力，包括新的數據處理軟體的應用，以報表和圖表等多種形式從科室、時間、醫師等多角度、精細化地展示數據[1]。醫院根據三級公立醫院績效考核、DRG點數付費方式改革的要求，制定了本院有關費用指標控制目標。
　　醫院費用指標分為門診費用指標和住院費用指標。統計人員每月在新建Excel中進行匯總計算及調整格式操作，這些傳統的數據處理方式存在多次手工操作、效率低下的特點。叶韻韶等人認為無論是直接在Excel中進行匯總計算及調整格式，還是採用統計軟體輸出粗略的數據再調整格式，無疑都是重複性手工勞動[2]。Python語言作為專業的腳本編輯語言，具有功能強大、操作簡單、通用的特點。藉助Python語言將計算結果導入預先設計好的報表模板中，極大地提高了工作效率。
　　1. Python介紹
　　Python已經成為最受歡迎的程序設計語言之一。自從2004年以後，Python的使用率呈線性增長。由於Python語言的簡潔性、易讀性以及可擴展性，在國外用Python做科學計算的研究機構日益增多，一些知名大學已經採用python來教授程序設計課程。Python具有的特點是：易於學習、易於閱讀、易於維護、有豐富的標準庫、有互動模式支持、可移植、可擴展、提供所有資料庫的接口、可嵌入。這使得Python可以應用到軟體開發、大數據分析、網絡爬蟲、機器學習、網站開發等不同領域[3]。
　　2. Python使用步驟
　　本文以住院費用指標為例，介紹Python在醫院統計中的運用。主程序依次完成三個功能，分別為：核對病案統計管理系統中出院者的總費用；計算各種費用指標；將計算完成的費用指標導入費用模板。
　　2.1 核對病案統計管理系統中出院者的總費用
　　目前病案統計管理系統是HIS系統的一個子系統，主要包含門診數據、人力數據、住院病案首頁數據、醫技數據，其中住院案首頁數據的利用最為廣泛，如全國三級公立醫院績效考核、醫療質量績效分析、醫保預付費等，病案首頁數據從電子病歷系統導入，數據分析前的數據質控是必不可少的步驟，這也正好符合了統計法對統計數據準確性的要求。為了確保病案統計管理系統中病案首頁總費用的準確性，將該系統中的數據與住院收費系統中出院患者的總費用進行比對。
　　從病案統計管理系統導出某月出院病人總費用，Excel命名為「文件1」，同時導出住院收費系統中同時期出院病人總費用，Excel命名為「文件2」，兩個文件同時包含欄位：住院號、姓名、出院日期、總費用。以「住院號」+「出院日期」兩個指標共同確定病人唯一性，比較同一病人兩個系統的總費用差異，若二者差異大於等於1元，則認為該病人費用信息錯誤，需進入電子病歷系統和住院收費系統查詢後修正。
　　具體程序如下：
　　2.2 計算各種費用指標
　　在Excel中製作住院次均費用報表模板，表名稱為：表*****年**月出院者住院次均費用報表。
　　2.3 將計算完成的費用指標導入費用模板
　　在聯眾病案統計管理系統中的「查詢條件輸入」模塊中輸入「（出院日期大於等於2021年04月01日）並且（出院日期小於等於2021年4月30日）」，「輸出項目設置」中選擇「病案號、病人序號、科主任、總費用、西藥類、中藥類、耗材類、手術治療費、病理診斷費、實驗室診斷費、影像學診斷費、住院天數」。將查詢結果進行「組合分析」。數據列優先排序欄位選擇「科主任」，計算列優先排序欄位選擇「出院人次、總費用、西藥類、中藥類、耗材類、手術治療費、檢查檢驗費、平均住院日」。將分析結果另存為Excel文件，取名「****年**月出院者住院次均費用報表-病案統計管理系統導出」。
　　data＿all表格是自己設計的各指標模板，data表格是從病案統計系統導出的各醫療組各項費用指標總和
　　3. 討論
　　本文介紹了Python在統計報表輸出中的應用，給出了多個系統數據的比對和製作出院者住院次均費用報表的程序。
　　隨著醫保付費方式改革和全國三級公立醫院績效考核的開展，醫院數據分析的廣度和精度也面臨著新的要求。宋慧等人將熟練運用Python作為醫院統計人員軟體應用能力之一[4]。醫院統計人員學會使用先進的數據分析軟體，才能保證及時、準確完成大數據時代各種統計任務。僅靠手動多次數據調整和表格制定，已經不能滿足現階段統計工作的需求，並且有些統計指標的計算按照傳統的方式已經無法完成，只有將設計思路寫入程序中，才能又快又準確地計算出統計指標值。
　　醫改新形式勢下，隨著醫院信息化程度的不斷提高，醫院統計工作對醫院統計人員的素質提出了更高的要求[5]。統計人員只有不斷改進自己的工作方式，才能滿足醫院精細化管理需求。
　　參考文獻
　　[1]黃躍，魏嵐，張董,等.基於大數據的醫院信息集成平台建設與應用[J].中國醫學裝備, 2019,16(4):103-105.
　　[2]叶韻韶,黃雪歡,韓棟.R語言在定製Exce|報表中的應用[J.中國醫院統計, 2020.4(27):184-192.
　　[3]王征. python從入門到精通( 1版) [M].北京:中國鐵道出版社有限公司, 2020:2-3.
　　[4]宋慧,趙曼,周靜,等基於大數據的三級綜合醫院統計人員能力現狀及相關因素分析[J]中國病案, 2021 ,22(4).20-23.
　　[5]史文宗,劉瑞吉,楊奕醫改新形勢下醫院統計工作管理模式的探討[J].中國醫院統計, 2020,27(2):153-160.
　　關於python的論文第二篇：基於Python的人機對話自然語言處理
　　摘要：本文調用了Python功能豐富的第三方庫jieba以及TextBlob,利用其強大的函數方法讀取了存於Text文檔中的科幻文學人機對話以及Siri和Cleverbot的對話文本並進行了分析；隨後藉助Excel實現了對於量化數據的可視化分析,並結合自然語言處理和語用學理論提出了一種強人工智慧的語言模式,最終實現了一次完整的基於Python的自然語言處理,為人工智慧中的人機對話領域的研究者提供了一種分析文本的可能思路。
　　關鍵詞: Python3.7; 自然語言處理;可視化分析;人機對話;語用學;
　　1 選題背景與意義
　　十三五期間，我國公布了《新一代人工智慧發展規劃》，該規劃描述了三個主要發展階段，確定了至2030年使中國成為人工智慧世界主要創新中心的目標。
　　實現強人工智慧人機對話的關鍵是理解並處理自然語言，但想要完成這一目標，除了語料數據的支撐，同樣需要人工智慧擁有情感交流的能力。根據傳播學的信息交互理論，人與人之間的內容溝通大約只占20%，而情感溝通要占到80%。因此，如何深層次地理解語境並進行合適的情感交流，是人機對話領域的重點。基於Python的英語自然語言處理已存有較多研究，但語料文本多出於網絡[1]，在科幻類文學中的人機對話領域，目前尚無成熟的研究。
　　在此背景下，本文將以文學文本中的人機對話為語料，基於Python的自然語言處理功能來分析文學作品中人機對話，並結合語用學理論，以此來整合出一種強人工智慧的語言模式。
　　2 Python自然語言處理需求分析
　　在對於科幻類文學中人機對話進行自然語言處理的過程中含有兩個關鍵步驟，其一是讀取文本並進行相關統計，其二是對其內容進行分析。
　　就第一部分而言，考慮到目標是文本分析，因此選擇是在自然語言處理領域已經較為成熟的jieba庫。基礎編程思路是利用jieba庫內置的豐富方法，如lcut函數，來進行分詞與詞頻統計等一系列相關處理。在具體讀取過程中，可利用Python的列表與字典功能對文本內容進行轉存[2]。
　　在進行第二部分時，考慮到Snow NLP和NLTK庫並不具備處理大量複雜的英語語言文本的能力，因此本文選擇了在英語語言國家更為常見的Text Blob庫[3]。統計完成後，本文將在運行結果的基礎上對於原始文本的數據進行分析，並基於（轉下頁）文學文本內容的情感得分和主客觀得分定義兩項新的評分，即「禮貌值」與「合作值」。
　　3 關鍵代碼說明以及代碼測試
　　3.1 所使用第三方庫介紹
　　如前所述，本文最重要的環節是文本處理，而在實現需求的過程中將主要調用Python的兩個第三方庫，分別為jieba庫與Text Blob庫，本部分將簡述這兩個庫的功能以及在本項目中所起到的具體作用。本部分代碼所調用第三方庫名稱以及應用：
　　(1)jieba庫：對原文文本實現分詞處理並進行統計詞頻
　　jieba庫是一款優秀的Python第三方分詞庫，支持三種分詞模式，函數簡單，容易上手。
　　(2)Text Blob庫：統計分析文本內容的情感傾向得分
　　Text Blob是用Python編寫的開源文本處理庫，可以用來執行很多自然語言處理的任務，比如，短語提取、詞彙標註、情感分析、語法分析、情感分析與添加語言新模型，等等[4]。
　　3.2 代碼設計
　　本部分將介紹代碼的兩個主體部分，其功能分別為統計詞頻和分析文本情感傾向。礙於篇幅所限，本部分只介紹重要代碼與編程思想，部分代碼將略去不表。
　　下述def代碼（1-25行）功能為統計詞頻，具體實現過程中調用了jieba庫[5]，隨後簡單使用cut方法設置停用詞並利用列表功能進行詞頻統計，本部分代碼的輸出文件將會是一個存有詞頻的Text文檔。代碼26-30行的功能為分析文本內容極性（即情感積極/消極程度）以及文本主客觀程度，在代碼中分別定義為「Emotion」與「Subjectivity」。此處代碼意在簡要說明Text Blob庫中重要的sentiment方法與polarity方法。
　　4 數據的可視化分析
　　4.1 對於科幻小說中人機對話的分析數據
　　本部分以Python的Text Blob庫所得出的源文本情感得分和主客觀程度得分為基礎，分別對於科幻類文學中的AI、i Phone助手Siri以及人工智慧機器人Cleverbot在相同對話中所做出的回答進行了文本分析。為了使得數據更加直觀，本部分選取了科幻類文學文本中較有代表性的30個問題，分別令人工智慧Siri和Cleverbot進行回答，結合科幻類文學中的人機對話，利用Excel進行數據的可視化分析。
　　分析結果表明，Siri和Cleverbot的情感得分分布圍繞著兩條基本線：-3.125和0（最大值為10而最小值為-10）。即Siri在面對多個問題時採取了「迴避策略」，即對問題表示不知道答案，這也是現有人工智慧在人機對話中的常見策略；與之相比，人工智慧Cleverbot則試圖在回答問題時保持絕對理智，儘量不夾帶情感。與之相比，科幻類文學中的AI則儘量與對話人保持相接近的情感傾向。
　　而在主客觀程度的得分上可以的出類似的結論，即科幻類文學中的AI儘量與源問題中的主客觀程度保持一致，而Siri與Cleverbot的回答得分分布依然圍繞著兩條基本線：6.875和0（最大值為10而最小值為0）。即Siri的回答更為主觀，而Cleverbot則儘量保持絕對客觀。這一點其實也與兩款人工智慧的市場定位有關：Siri的市場定位是「私人辦公助手」；而Cleverbot則是用於智能對話的機器人。故此，Siri的回答會基於「為i Phone用戶提供個性化的幫助」而變得更加「私人化」，而Cleverbot則採取了「理智回答」方案。
　　4.2 禮貌值與合作值
　　參考前部分的數據分析結果，可得出四項分析內容的平均分：
　　如上表所示，四項內容在情感內容平均分上相差不大，雖然可從主客觀得分上判斷出Siri和Cleverbot的明顯不同，但由於源問題各不相同，很難單一用平均分進行判斷。故此，本項目引用自定義的兩個評分項，分別為合作值「C」與禮貌值「P」，其定義式如下：
　　其主要數據對比為情感得分與主客觀得分的差值，即反應兩者之間的極性。禮貌值與合作值的平均分如下：
　　5 人機對話自然語言處理以及語用學分析結果
　　1983年，Leech在《語用學原則》一書中提出了禮貌原則，其中包括兩條重要準則，一致原則與同情原則[6]。即減少自己與別人在觀點上的不一致[7]。除此之外，格萊斯1975年在「邏輯與會話（Logic and Conversation）」一文中指出了合作原則的原則，其中包括量準則、關聯準則以及方式準則，即避免言語晦澀，邏輯要簡潔清晰[8]。
　
　　圖1 強人工智慧語言模式
　　基於前文分析，可以得出結論，科幻類文學中的「強人工智慧」不論是在情感還是主客觀程度上都傾向於與對話者保持一致，但現有的人工智慧則傾向於在對話中採納以「迴避」為主的消極主觀態度(例如Siri)或以「不犯錯」為主的中性客觀態度(例如Cleverbot)。實際上，人工智慧AI的對話原則與語用學的兩大原則，即「禮貌原則」與「合作原則」[9,10]，不謀而合，亦即是說，這兩條原則可以成為人工智慧語言模式中的一部分。具體到人機對話領域中，人工智慧應當儘量在對話時與對方在情感與語言極性上保持一致，同時使得自己的話語與對方在邏輯、主客觀程度和信息量上達到態度一致，圖1。
　　6 結論
　　本文調用了Python的jieba庫詞頻統計、Text Blob庫情感分析以及re庫Python辦公自動化等多種功能，實現了一次完整的基於Python的自然語言處理，為人工智慧中人機對話領域的研究者提供了一種分析文本的可能思路。但文章中尚存有不少課繼續探究之處。首先，自然語言處理並非只能局限於Python，目前這一領域的研究已經較為成熟，在經過外文文獻閱讀後可以得到更多的研究視角；其次，Text Blob庫以及Snow NLP庫只是Python強大第三方庫中的冰山一角，倘若對於Python加以更富有創造性的使用，勢必可以獲得更加客觀且更富有統計學意義的分析結果，而更加前沿的研究，則需要未來更加深入且不間斷地探索與思考。
　　參考文獻
　　[1]Rafeeque Pandarachalil, Selvaraju Sendhilkumar,G SMahalakshmi.Twitter Sentiment Analysis for Large-Scale Data An Unsupervised Approach[J]. Cognitive Computation,2015,7254-262.
　　[2]塗小琴基於Python爬蟲的電影評論情感傾向性分析[J]現代計算機,2017,35:53-55.
　　[3]Farha Nausheen, Sayyada Hajera Begum. Sentiment Analysis to Predict Election Results[A].Proc eedings of the Second International Conference on Inventive Systems and Control[C]1st ed,Kwangsu Lee ,Cham:Springer Nature Switzerland AG2019, 1259-1262.
　　[4] Python文本情感分析[EB/OLhttps://www. janshu. com/p/b775f978b004,2019.
　　[5]成文瑩,李秀敏基於Python的電影數據爬取與數據可視化分析研究[J]資料庫與信息管理,2019,31:8-10.
　　[6]Michelle Z.Rosaldo.The Things We Do with Words.llongot Speech Acts and Speech Act Theory in Philosophy[J].Language in Society, 1982,(11)2:203-237.
　　[7]Pintip Hompluem Dunn.How Judges overrule:Speech Act Theory and the Doctrine of Stare Decisis[J].Yale Law Journal2003,113.493-51.
　　[8]Kent Bach.The Myth of Conventional Implic ature[J]L inguistics and Philosopl,.999.22,327-366.
　　[9]Bethan L Davies. Grice's Cooperative Principle:Meaning and rationality[J].Journal of Pragmatic s,2007.(39)12:2308-2331.
　　[10]張曉麗.王券斐.《從合作原則淺析小說《傲慢與偏見》中的人物對話》[J] 外國文學,2014,8:319.
返回本篇論文導航