オライリージャパン Search オライリージャパン オライリージャパン オライリージャパンSpidering hacks―ウェブ情報ラクラク取得テクニック101選
オライリー・ジャパン Search オライリー・ジャパン オライリー・ジャパン
by Kevin Hemenway Tara Calishain Search Kevin Hemenway Tara Calishain Kevin Hemenway Tara Calishain
Customer Reviews:楽しく読めて、実用的 
「Perlをある程度勉強している」+「Webページから情報を抜き出すことに興味がある」
の二項目に当てはまれば持っていて損はない本だと思います。
もともとが洋書であるため、対象サイトが海外のものであるのもちらほらありますが、
翻訳する際にソースや内容も日本人向けに変更しているのでそこまで問題になりません。
翻訳もよく、難しくも面白い内容を取り扱っている本なので、
個人的には買ってよかったと思える本でした。
因みに、自分はスパイダリングに関する本を読んだのはこれが初めてですが、
初心者(Perlの知識はある程度必要)でも全く何が書いてあるのか分からないということはありませんでした。
情報収集 
このHacksシリーズのよさは、テクニック100選にあるかもしれない。
技術を体系的に教えようとしたり、解説しようとすると、書きたいことが多すぎて、整理しきれないことがある。本書のように、100という制約を設けると、じゃ、何を書いて、何を削ろうという選択がしやすい。そのため、内容も厳選され、質も揃うことになるのではないかと推測できる。
ただ、本書だけは101になっている本当の理由はなんだろうかは興味がある。
Spideringという情報検索(収集)ロボットに関する技術紹介である。
自分のPCに取得した方がよいか、常にネットにつながるところで作業するかは、仕事の仕方によるかもしれない。
情報の機密性、価値などに対する考え方で、集めてくるのがいいかどうか。
情報の整理の仕方についても考えさせられる。
回り道しても読む価値がありました 
私には投資のためにウェブ情報を利用するアイデアがあり、それを実現する方法を探していた時にこの本を見つけました。
書いてある事は興味深かったのですが、事例のほとんどがPerlで書かれており、Perlがわからないのでさっぱり理解できません。そこで入門本を買ってPerlの学習から始めました。そのために数ヶ月回り道しましたが、その価値はあったと思います。「知りたい事を知る事ができた」というより「自分の世界が拡がった」感じです。
『Hacks』の白眉 
2004年5月26日リリース。O'REILLYの『Hacks』シリーズの邦訳。最近のO'REILLYの『Hacks』のシリーズと『The Missing Manual』シリーズはどれも見逃せない面白さである。(●^o^●)
『Spider』とはインターネットから様々な情報を自動的に取得するプログラムの総称である。ネットの海から欲する情報を吸い出す。それは単にWWWだけでなく、例えば電子メールのPOP3サーバから添付ファイルだけを抜き出す。それら徹底した収集方法を獲得し、次にそれらをRSSを用いてデータを再利用したり、ダッシュボードのウイジットの引っ張るデータとしたりする。(●^o^●)最高にCoolな本である。
特徴として執筆者2名を支える『貢献者』が圧倒的に厚い(熱いとも言える(●^o^●))事が上げられる。それがこの本の中身をすばらしいものにしている!!!『Hacks』の白眉が本書である。
混沌のWEBからデータを収集した人は必読 
WEBから特定の情報源を収集して、体系立てて保存したいと考えている人は、必読。
本書は文字列の処理に優れたPerlを中心に記述されているが、WEBアプリケーションに特化したPHPのサンプルが紹介されている。
収集したデータをブログで利用されているRSS(XML)形式にして再公開するための手法も紹介されている。
さらに、スパイダーを運用するに当たっての注意事項などにもページを割いている点は好感。
そして、原著は米国で記述されたものだが、翻訳をする際に日本独自の記述もあり、日本語処理などに戸惑うことは少ないだろう。
買って損なし。値段以上の価値がある。
Listmania Lists:〜Hacks 入門オライリーの本HACKS衝動買いした技術本たちLightWeight Language で行こう!右も左も分かりませんコンピュータで出来るあれこれ買ったもの2005ブログ・アフィリエイトスキルアップの為に欲しい本関連商品:
related blog:
PHPでHTMLを解析 - seindex
PHPでHTMLを解析. 参考記事. http://q.hatena.ne.jp/1145454292. この回答の5が参考になる. ■書籍. Spidering hacks―ウェブ情報ラクラク取得テクニック101選. ■サンプルソースのダウンロード. http://www.oreilly.co.jp/books/4873111870/download.html ...
http://www.seindex.net/2009/11/phphtml.html
2006-05-31
screenshot [http://www.sixapart.com/:image] audio [http://yapc.g.hatena.ne.jp/files/yapc/e537f5b7a74e2fbf.mp3:sound] video [https://hatena.g.hatena.ne.jp/files/hatena/b9f933.flv:movie] book isbn:4873111870:detail.
http://d.hatena.ne.jp/miyagawa/20060531
[book]spidering hacks
[asin:4873111870:detail]
http://d.hatena.ne.jp/naknak/20070621/p4
spidering hacks注文した
ちょっとしたwebサービスを思いついたので その実装方法に関する調査をしたいので購入。 [asin:4873111870:detail]
http://d.hatena.ne.jp/akio0911/20070712/1184245943
買うと思う。
isbn:4873111870:detail 先ほど注文してきました。
http://d.hatena.ne.jp/ytakateru/20061217/p1
廃人オナニート日記 - 本を書きたい
同種の本に. Spidering hacks―ウェブ情報ラクラク取得テクニック101選. 著者/訳者:Kevin Hemenway Tara Calishain. 出版社:オライリー・ジャパン( 2004-05 ). 定価:¥ 3675. Amazon価格:¥ 3675. 単行本 ( 516 ページ ). ISBN-10 : 4873111870 ...
http://www.onaneet.org/blog/2009/01/08/%E6%9C%AC%E3%82%92%E6%9B%B8%E3%81%8D%E3%81%9F%E3%81%84/
分かりやすい、オススメのperlの入門書を教えて下さい。 実はこの本 ...
実はこの本 http://www.oreilly.co.jp/books/4873111870/ を買ったのですが、難しくて理解できません・・・・ 私のレベルはHTMLで単純なHPを作ったりcgiを設置出来る程度で、自分でプログラミングはやった事がありません。 宜しくお願いします。 ...
http://q.hatena.ne.jp/1165274215
廃人オナニート日記 - 本ネタ
Spidering hacks―ウェブ情報ラクラク取得テクニック101選. 著者/訳者:Kevin Hemenway Tara Calishain. 出版社:オライリー・ジャパン( 2004-05 ). 定価:¥ 3675. Amazon価格:¥ 3675. 単行本 ( 516 ページ ). ISBN-10 : 4873111870 ...
http://www.onaneet.org/blog/2009/02/04/%E6%9C%AC%E3%83%8D%E3%82%BF/
spidering hacks
amazon.co.jp: 新版perl言語プログラミングレッスン入門編: 本: 結城浩 http://www.amazon.co.jp/dp/4797336803/. oreilly.co.jp -- online catalog: spidering hacks http://www.oreilly.co.jp/books/4873111870/toc.html.
http://gero.cocolog-nifty.com/blog/2007/11/spidering_hacks.html
[参考文献] 良さそうな本を見つけた
[asin:4873111870:detail] 目次を見る限り、これはいい。すぐにでも読みたい。今日は本屋に行けるかな?
http://d.hatena.ne.jp/Megumi221/20080606/1212787232