程式語言

1/7ページ

程式語言JavaScript簡介

JavaScript 是什麼? JavaScript 是一種廣泛應用於客戶端網頁(瀏覽器)開發的指令碼語言,如用來給 HTML 網頁新增動態功能,比如響應使用者的各種操作等。JavaScript 是一種基於物件(Object)和事件驅動(Event Driven)並具有安全效能的指令碼語言,大部分情 […]

學習JavaScript程式語言的8張思維導圖分享

學習的道路就是要不斷的總結歸納,好記性不如爛筆頭,so,下面將po出8張javascript相關的思維導圖。 思維導圖小tips:思維導圖又叫心智圖,是表達發射性思維的有效的圖形思維工具 ,它簡單卻又極其有效,是一種革命性的思維工具。思維導圖運用圖文並重的技巧,把各級主題的關係用相互隸屬與相關的層級 […]

Python即時網路爬蟲專案: 內容提取器的定義

1. 專案背景 在python 即時網路爬蟲專案啟動說明中我們討論一個數字:程式設計師浪費在調測內容提取規則上的時間,從而我們發起了這個專案,把程式設計師從繁瑣的調測規則中解放出來,投入到更高階的資料處理工作中。 2. 解決方案 為了解決這個問題,我們把影響通用性和工作效率的提取器隔離出來,描述瞭如 […]

API例子:用Java/JavaScript下載內容提取器

1,引言 本文講解怎樣用Java和JavaScript使用 GooSeeker API 介面下載內容提取器,這是一個示例程式。什麼是內容提取器?為什麼用這種方式?源自Python即時網路爬蟲開源專案:通過生成內容提取器,大幅節省程式設計師時間。具體請參看《內容提取器的定義》。 2, 用Java下載內 […]

讓Scrapy的Spider更通用

1,引言 《Scrapy的架構初探》一文所講的Spider是整個架構中最定製化的一個部件,Spider負責把網頁內容提取出來,而不同資料採集目標的內容結構不一樣,幾乎需要為每一類網頁都做定製。我們有個設想:是否能做一個比較通用的Spider,把定製部分再進一步隔離出去? GooSeeker有一個爬蟲 […]

Python網頁資訊採集:使用PhantomJS採集淘寶天貓商品內容

1,引言 最近一直在看Scrapy 爬蟲框架,並嘗試使用Scrapy框架寫一個可以實現網頁資訊採集的簡單的小程式。嘗試過程中遇到了很多小問題,希望大家多多指教。 本文主要介紹如何使用Scrapy結合PhantomJS採集天貓商品內容,文中自定義了一個DOWNLOADER_MIDDLEWARES,用來 […]

Python爬蟲實戰(3):安居客房產經紀人資訊採集

1, 引言 Python開源網路爬蟲專案啟動之初,我們就把網路爬蟲分成兩類:即時爬蟲和收割式網路爬蟲。為了使用各種應用場景,該專案的整個網路爬蟲產品線包含了四類產品,如下圖所示:本實戰是上圖中的“獨立python爬蟲”的一個例項,以採集安居客房產經紀人(http://shenzhen.anjuke. […]

1 7