命名實體識別(NER)是一種自然語言處理任務,用于識別文本中的實體名稱,這些實體可以是人名、地名、組織機構、日期、貨幣等。簡單來說,就是讓電腦學會“指認”文本中的“大人物”。
為了讓大家更好地理解NER,我們來寫一些Python代碼。我們將使用 spaCy 這個強大的自然語言處理庫來進行命名實體識別。
首先,我們需要安裝spaCy庫及其英語模型:
pip install spacy
python -m spacy download en_core_web_sm
接下來,我們編寫一些Python代碼來識別文本中的命名實體:
import spacy
# 加載英語模型
nlp=spacy.load('en_core_web_sm')
# 定義一段文本
text="Bill Gates is the founder of Microsoft. He was born in Seattle on October 28, 1955."
# 處理文本
doc=nlp(text)
# 遍歷實體
for ent in doc.ents:
print(ent.text, ent.label_)
這段代碼會輸出文本中的實體以及它們對應的類型。例如:
Bill Gates PERSON
Microsoft ORG
Seattle GPE
October 28, 1955 DATE
為了使代碼更有趣,我們可以添加一個功能來統計不同類型的實體出現的次數。這樣可以幫助我們了解文本中哪種類型的實體最多。
from collections import Counter
# 統計實體類型
entity_counts=Counter([ent.label_ for ent in doc.ents])
# 打印統計結果
for label, count in entity_counts.items():
print(f"{label}: {count}")
通過使用像spaCy這樣的庫,我們可以輕松地識別文本中的各種實體,并對其進行分類。這對于處理大量的文本數據特別有用。
腦正經的稱呼是電子計算機,根據名字就知道它是一種計算工具。在我們祖先全身毛還沒有褪去的時代,石頭就是他們的超級計算器,一塊石頭就是一只獵物,這有點太考驗想象力了。
科普界的泰斗阿西莫夫說:人類最早的計算工具就是手指,我們大中國就聰明的多,那時候我們就用結繩了,方便攜帶,技術含量多。后來隨著人類文明的進步,好多國家智商變態的人開始用籌碼改良計算工具,最牛逼的還是我們中國的算籌。
商周時代,我們就有一種竹制、木制或骨制的小棍,在地上或盤子里反復擺弄,就能算出個一二三四五來。我們中國的大學者祖沖之,腦筋比超導體還靈活,就用這些棍子率先算出了圓周率小數點后的第六位。
歐洲那嘎達是按格子乘法來的,畫個矩形,分成小格,寫下數字,然后斜著加起來才得出結果,簡直比老婆出門化妝還麻煩。
后來英國一位腦子開過光的數學家納皮爾,將格子乘法表中可能出現的結果,印刻在一張細長的算籌上,通過擺放算籌來進行乘法、除法或其他運算。然而這種方法一旦遇到復雜的運算,就變得混亂復雜。因此我們中國人又創造出了一種新型的計算機。
這種計算機號稱價格低廉,絕無故障,節約能源,十年內無需任何維護,那就是算盤。這玩意配合著一套口訣,這口訣就是這算盤的軟件,好用著呢,簡直就是加減乘除,輕輕松松。計計算算,速度如風。
后來天文學和航海學的發展,讓計算工作變得越來越繁重。英國數學家奧特雷德靈光一閃,想到如果采用兩根相互滑動的對數刻度尺,不就省得用兩腳規度量長度嗎?不過他也真的就是僅僅意淫了一下,自己想想嘿嘿一樂,別人也不知道他到底樂的啥。
直到18世紀末,蒸汽機之父瓦特,他的蒸汽工廠投產之后,就要迅速計算蒸汽機的功率和氣缸容積。瓦特就把奧特雷德的想法變成了現實。1850年之后,快速。對數計算尺得到了迅速發展,成為工程師們必不可少的隨身計算機。直到20世紀五六十年代,它仍然是代表工程學生身份的一種標志。
謝謝觀看,記得關注、點贊、評論和轉發!
于電腦自帶正版office激活的問題/竅門!
假如有一臺電腦自帶的正版office需要用微軟賬戶激活,那么我們就可以自己(電腦使用者)的QQ郵箱或辦公郵箱按著office激活向導,注冊為微軟賬戶,并從原郵箱獲得驗證碼,即可順利注冊成功微軟賬戶,繼續按向導操作,即可完成正版office激活!
如果是公司多臺電腦中的正版office需要激活,則沒有那么郵件多賬號來注冊微軟賬戶。
如果用同一個微軟賬號激活,則容易出現不同部門人員在不同電腦上使用后,出現數據泄露問題。原因是微軟賬號一登錄,容易出現數據上傳,同一微軟賬戶下的不同電腦上都可以瀏覽該賬戶下office使用的文件記錄。
解決公司的多臺電腦中的office需要激活的問題如下:
就是按著office激活向導從新注冊outlook.com為后綴的新的微軟賬戶,按向導注冊成功后,繼續按向導操作,就可以順利激活office,過程中不需要登陸該新注冊的微軟賬戶,也不需要給該賬戶發送驗證碼,整體來說還是比較簡單。
這里面有幾個竅門:
1-起名。該注冊成功微軟郵件賬戶的名字可以根據實際情況起名,比方說diyihuishi@outlook.com,dfzz1@outlook.com(東方之珠1),zhang168@outlook等,這樣,如果電腦是領導的,領導對這方面又沒有特殊要求,就可以經得領導同意,新建一個跟領導相關一點的微軟賬戶,直接幫領導激活就行了,就不用耽誤領導的時間了。
對于公司多部門公用的電腦中的正版office激活,經得相關人員同意,也可以采用這個原則來激活。
2-注意要注冊outlook.com為后綴微軟賬戶!
不要用hotmail.com為后綴的微軟賬戶。因為這個就沒有這么簡單,反正就是相對復雜,大家知道了、明了,然后不采用這個方式就可以了。也就不費口舌來說明了。