你是否好奇過淘寶上那些代找PDF的賣家都是哪來的資源?
好像無論什么電子書他們都能幫你找到
而且最主要的是:這種店家還不只一家,有幾十上百家???
講道理,如果資源是商家自己的 or 技術是商家自己原創的,肯定不會出現幾十上百家同類店鋪的
那說明背后一定是有什么公用的途徑!
阿虛花了不少時間調查,基本摸清了這個行業背后的一些 “ 內幕 ”
今天就給大家來揭秘一下
看完這篇,你也可以輕松下載到絕大部分的PDF(包括教材?。?/p>
▍1 背后是一家什么樣的公司?
如果你有在淘寶不同的賣家試過代找PDF
不難發現,雖然賣家不同,但從反饋的截圖看來,其實是同類網站
▲圖源,知乎網友
雖然賣家反饋的不是完整截圖,但憑阿虛多年的互聯網經驗 + 非凡的記憶力,這幾個網站阿虛還是一眼就看出來了
順利邁出發現背后秘密的第一步
具體是哪些網站呢?其實就是下面這3個
而進一步查詢這3個網站的備案信息()會發現,龍巖網絡圖書館、全國圖書館參考聯盟、讀秀三者實際是一家的
前面兩個面向公眾開放,是讀秀的馬甲,而讀秀一般需要登錄才能使用
它們母公司叫超星,全稱北京世紀超星信息技術發展有限責任公司,是個數據庫公司
高校的同學們肯定都很熟悉「超星」這倆個字——超星爾雅、超星學習通、超星發現等等,都是它旗下的產品
那為啥超星能有這么多市面上沒有的電子書呢?
超星實際是中國數字圖書館建設初期,為了解決大部分圖書館沒有數字資源才應運而生的。換句話說就是:
學校圖書館和超星合作,超星幫忙掃描紙質資料做成PDF版來建設電子圖書館,但同時也把一份副本傳到他自己的服務器上
據悉目前超星圖書館藏書量超過350萬,具體資源不止2300T
通過與圖書館合作,直接在資源數量上甩開競爭對手幾光年,讓超星成為了全國乃至全球最大的中文電子圖書提供商
雖然沒有機構能買全庫,但一般的學校都會買個幾十萬冊的超星書庫,與學校圖書館紙質書互補,在校學生可直接使用
但圖書館都沒有那么多書庫,淘寶商家是哪來的呢?
據小道消息:超星有個自己的平臺,充值200后,上面大部分1塊錢就可以買1本,淘寶多數商家其實就靠這個在賺差價
但這個平臺是否真是超星自己的,阿虛也沒去實證,大家就自己判斷吧
▲據說此軟件有350W資源
這里且不討論淘寶書商下載電子書后拿來出售所造成的侵權行為
阿虛來說說更多人關心的一點——我們一般人,可不可以下載到讀秀/龍巖/全圖上面的資源?
答案是可以的,而且還是正規途徑!
原來有個平底鍋油猴腳本,可以快速方便購買讀秀/龍巖/全圖上帶書簽目錄的PDF版電子書。但很可惜,可能是版權問題吧,后來作者停止服務了,所以現在現在要么還是走淘寶,或者靠下面的免費方法吧
▍2 圖片緩存大法
不知道,肯定很多人不知道!
阿虛原來其實寫過怎么免費獲取讀秀上面的電子書的:
方法就是注冊那些免費開放注冊的圖書館,然后我們就能免費使用圖書館購買的數字資源庫了
總之,注冊教程請看上面那篇文章,注冊好賬號之后再繼續看這篇文章的下文
這里舉例使用廣西壯族自治區圖書館
從網頁登錄圖書館,并找到數字資源,再找到「讀秀知識庫」,點擊包庫入口進去
接著我們在圖書一欄進行搜索,如果搜索出來的結果顯示「包庫全文」
那么這本電子書我們就是可以有辦法免費獲取到PDF版的?。。?/p>
我們點擊包庫全文打開,這時實際就可以下載了
● 2.1 安裝新版超星閱讀器
但下載的前提是你需要先下載新版的超星閱讀器:
因為新版的才支持打包下載(至少阿虛測試的時候舊版不行)
然后你就可以下載到一個PDZ格式的文件
如果你對PDF不是剛需,到這一步實際上就可以了
如果想把PDZ格式轉成PDF的話,請繼續往下看
● 2.2 獲取圖片緩存
使用超星閱讀器器打開這本書,頁面大小設置為100%
同時打開我的電腦,找到這個目錄:C:\Users\電腦用戶名\\Local\Temp\(如果PDZ是文字版,則生成的文件夾不是而是)
然后你就會發現這個目錄下,會有超星閱讀器生成的掃描圖片的緩存文件
準確的說是打開一本書后,每翻一頁即會在該目錄下生成當前頁和下一頁的BMP圖像
而生成的圖像分辨率和頁面大小設置有關,這也是為什么上面讓你把頁面大小設置成100%
那實際不就很簡單了*?
我們只需要一直點擊下一頁(按方向鍵→),把整本書都翻完,就能獲取到所有頁面的圖片了
如果覺得手動點擊太麻煩,你可以用鼠標連點器啊!
推薦點擊間隔設置為0.6秒,你還可以在設置里面設置好翻頁次數(軟件取方式見文末)
別覺得這個方法麻煩,實際上500頁的PDF靠鼠標連點器的話,也只需要5分鐘就能翻完
相對后面要介紹的第2、3種方法,要快得多
● 2.3 合并PDF
總之等你把正本電子書都翻完后,注意,注意,注意!先不關閉軟件,把目錄下的所有圖像文件拷貝到其他位置的文件夾,然后才能關閉超星閱讀器
接著我們用一些PDF編輯器把這些圖片合并成PDF即可
如果你嫌棄裝福昕、金山、一類的PDF編輯器太麻煩,推薦你可以用PDF補丁丁這款軟件
一般10多秒鐘就能合并完成了:
如果你覺得合并后生成的PDF太大了,除了PDF壓縮,或者在合并前批量壓縮圖片
你還可以選擇之前的頁面大小可以不設置成100%,設置成50%之類的(其實39%也足夠清晰了)
● 2.4 沒有顯示包庫全文怎么辦?
沒有顯示包庫全文,只是意味著你使用的圖書館并沒有購買這本書的資源
但只要讀秀上能部分閱讀,或者預覽到前言頁等,就說明超星實際是有這本書的全文資源的
另外可能會有粉絲問,哪些圖書館購買的讀秀書庫會比較多呢?
網上據說是浙江圖書館、重慶圖書館購買的書庫都比較多
不難推斷出書庫購買的多少應該是和圖書館的財力有關
另外也不難推斷出,醫科大學的圖書館會購買更多醫科相關的電子書,畢竟圖書館購買書庫的目的是和館藏做互補
還有一些書是顯示部分閱讀,但點進去會顯示「您訪問的資源有錯誤」,這類書應該是出于版權保護沒有公開。這種書如果想獲取,還是只能寄希望于百度,或者一些電子書站
▍3 新版超星閱讀器+虛擬打印機大法
除了以上方法可以快速把PDZ格式轉為PDF格式,原理上靠虛擬打印機打印的方法也很簡單
但阿虛實測轉換效率沒有上面那個方法高,所以就不主要推薦了
想了解具體方法的的話,可以手動點擊展開這部分的內容(400+字,點開就不能收回了!自行考慮)
第一步仍然是用新版超星閱讀器把電子書下載下來
● 3.1 打印為XPS
打開PDZ電子書之后,在超星閱讀器上面右鍵,選擇打印
注意:前言頁、目錄頁、正文頁需要分開打印才行!
在前言頁的第一頁選擇:從當前頁開始打印,同時前言頁有12頁就打印12頁,其他同理
接著就是技巧了——因為PDZ格式不支持打印為PDF,但可以打印為XPS!
所以我們選擇下圖這個XPS虛擬打印機
選好之后,自己設定輸出目錄并等待打印完成
XPS是當初微軟為了對抗Adobe的PDF而開發的一種電子文件格式
● 3.2 打印為PDF
然后用XPS 打開輸出的XPS文件(軟件獲取方式請看文末)
接著梅開二度,點擊左上角打印,選擇PDF的虛擬打印機
● 3.3 手動合并
按這個方法把前言、目錄、正文都再打印一遍后,我們用個PDF合并器,把這3個PDF合并起來就行了(軟件獲取方式請看文末)
總而言之什么軟件可以做成書,經過一頓打印,終于讓我們把PDZ格式清晰地轉換成了PDF文件!
但有個缺點,通過這種方式最終得到的PDF,一般都會非常的大(上圖也可以看的出來)
● 3.4 備注說明
XPS 這個工具被集成到了 Vista 和 WIN7 系統中,所以這倆系統是可以直接打開XPS文件的
而如果你是WIN10,且在打印PDZ文件的時候,沒有XPS打印的虛擬機,請嘗試下圖的操作:
用WIN+Q(或WIN+S)呼出WIN10搜索框,搜索「啟用或關閉功能」
在彈出的窗口,打開「 XPS 文檔寫入程序」即可
如果你的「 Print to PDF」功能沒打開,也請一并打開
▍4 分章節下載+文獻傳遞大法
如果你想下載的那本書,顯示為部分閱讀,意思就是不能全文下載,怎么辦呢?
這種阿虛是比較建議你用花錢解決的
因為雖然還是有白嫖的辦法,但麻煩與耗時程度都拉滿了!
如果你真的舍不得花那幾塊錢的話,可以展開下文來查看具體的方法
● 4.1 先靠目錄頁下載到大部分章節
在讀秀上,打開這本書的目錄頁
在目錄頁我們能查到這本書每一章的章節名
我們直接到讀秀的「知識」一欄進行搜索
因為第一章的章名是《概述》,這種就沒辦法進行搜索,我們就搜第一章第一節的節名,發現我們是可以直接下載這一節的
點擊PDF下載,在彈出的界面右鍵另存為,我們可以觀察自動生成的文件名,最后的部分實際上就是下載下來的頁數
就靠這樣,一節一節、一章一章的進行下載
雖然每次能下載的頁數會比較少,但這個方法的關鍵是不限制次數與頁數!!
只要你足夠耐心,是可以把整本書都下載下來的
不過實際上,就算每一章節都靠這個方法能下載下來,但還是可能會遇到中間有缺頁
● 4.2 再靠文獻傳遞補齊
剩下的部分我們可以靠文獻傳遞來補齊
但文獻傳遞有個很大的缺點:每本圖書單次咨詢不超過50頁,同一圖書每周的咨詢量不超過全書的20%
意思就是說只要有一個人在一周內咨詢滿了這本書的20%,那么之后所有人在這周內都不能再對這本書進行咨詢
點擊文獻傳遞后,去郵箱收取郵件,并打開里面的鏈接
彈出的頁面上,點擊PDF就能下載了
這個方法就算最后能把全文獲取到了,最后還需要自己手動合并PDF、刪去重復的頁數
但這個就不在這里展開了,阿虛在原來PDF去水印這期教程里,有教過怎么用 來合并、編輯 PDF,可以參考一下:
▍5 給PDF添加書簽
通過上面方式獲取到的讀秀PDF電子書,要么就是沒目錄書簽,要么就是像下圖這種「有等于沒有」的書簽
而PDF有書簽的話,真的會方便很多,所以阿虛這里再教一下怎么生成書簽
不過如果你不需要,可以略過此部分
● 5.1 重新下載電子書
第一步就是把之前超星閱讀器下載的電子書刪掉!
再重新到讀秀上下載一遍電子書,注意這次要選擇:分頁下載!
這一步的目的是為了獲取下載后的文件夾里面 .dat 這個文件,它里面包含了書簽信息!
然后用 這個軟件打開它(獲取方式見文末)
軟件里面就能加載出目錄了,我們先全選,并復制所有的目錄信息
● 5.2 加上書簽
再用 打開你剛剛制作好的PDF
接著全選,Ctrl+V 粘貼剛剛復制的目錄信息就行了
不過這時我們需要矯正一下目錄誤差!
比如這里目錄是第1頁,而實際PDF中是第7頁
我們需要手動矯正這個誤差——點擊PDF目錄選項,7-1+1=7,所以基準頁這里填 7
避免大家不懂,這里再舉個例子,假如獲取到的目錄頁是5,而實際PDF的頁數是14,那么基準頁那里就要填10
總之基準頁填好之后,點擊左上角的保存
這時候我們打開PDF就已經有比較不錯的目錄了
但有個缺點是現在這種目錄沒有層級結構!
▲目錄沒有縮進
也能用,但強迫癥看起來可能會不舒服
● 5.3 給目錄加上縮進
想給目錄加上層級結構的話,我們需要手動編輯
再把PDF拖進什么軟件可以做成書,建議是點擊切換到樹形編輯模式,比較明顯一點
我們這時候只需要用到下圖這一個功能,其實通俗點講,這個功能就是:縮進
目錄的層級結構是怎么樣的大家應該都懂吧,總之下圖阿虛演示了一下怎么對第一章的目錄進行縮進:
總之全部縮進完成之后,記得點擊左上角的保存,最后我們就擁有完美的目錄啦!
● 5.4 自動添加縮進
不過如果 .dat 文件獲取到的目錄信息是這種格式,其實是可以靠軟件可以直接自動生成層級結構的
我們只需要點擊「自動切分頁碼」這個功能,就能一鍵生成了
手動選擇目錄信息,再點擊自動切分頁碼即可:
▍6 全文總結與軟件下載
文中提到了以下4個的軟件:
鼠大俠鼠標連點器(用于圖片緩存法)
XPS (用于虛擬打印機法)
PDF補丁丁(用于合并圖片為PDF)
(用于編輯PDF目錄書簽)