Tuesday, July 31, 2007

yetibot@naver.com対策

先日robots.txtを試してみたYetiさんですが、結果から先に書きますと、まったくダメでした。理由は(1)Crawl-delayはまったくみていないみたいで、クロールの間隔はまったく変わらず (2) cssを読みにくるひとは"Yeti"ではないので、robots.txtは関係ないみたい、ということでぜんぜんダメ。

というわけでなにかちがうことを考えないといけないのですが、そのまえにまず現状を確認しておきましょう。例えば昨日のアクセスパターンは次のようなかんじ。


....
61.247.217.33 [30/Jul/2007:03:02:06 /tags/%E3%83%81%E3%82%A7%E3%82%B9
61.247.196.54 [30/Jul/2007:03:02:17 /css/stdstyle.css
61.247.217.37 [30/Jul/2007:03:02:31 /words/dead/rock
61.247.196.35 [30/Jul/2007:03:02:41 /css/stdstyle.css
61.247.196.26 [30/Jul/2007:03:02:54 /css/stdstyle.css
61.247.217.37 [30/Jul/2007:03:02:56 /tags/geena
61.247.196.54 [30/Jul/2007:03:03:12 /css/stdstyle.css
61.247.217.36 [30/Jul/2007:03:03:23 /words/dead/girls
61.247.196.39 [30/Jul/2007:03:03:38 /css/stdstyle.css
61.247.217.33 [30/Jul/2007:03:03:59 /words/%E3%83%91%E3%83%83%E3%82%BD/cm
61.247.196.37 [30/Jul/2007:03:03:59 /css/stdstyle.css
61.247.217.35 [30/Jul/2007:03:04:48 /words/youtube/%E3%83%93%E3%83%AA%E3%83%BC%E3%82%BA
61.247.217.37 [30/Jul/2007:03:04:49 /words/%E3%83%91%E3%83%83%E3%82%BD/%E4%B8%AD%E5%8F%A4%E8%BB%8A
61.247.196.40 [30/Jul/2007:03:04:50 /css/stdstyle.css
61.247.196.54 [30/Jul/2007:03:04:54 /css/stdstyle.css
61.247.217.35 [30/Jul/2007:03:05:01 /words/yahoo!/japan
...(以下略)...

7/30 午前3時から7/31午前3時までの24時間で受けた全リクエスト10796中、6804がYetiさんです。占有率63%。1分あたり4.7リクエスト。本体とcssとを組にして読んでいきますから1分あたり2.36リクエストx2ということですね。baiduさんですら2分に1回なのにねえ...よみすぎー。

というわけでまず、cssを禁止にしちゃう。Naverからcssを読みにきているIPアドレスの一覧は以下の通り。


  65 61.247.196.11
  82 61.247.196.13
  86 61.247.196.14
  59 61.247.196.15
 107 61.247.196.17
  84 61.247.196.18
  90 61.247.196.19
 100 61.247.196.20
  87 61.247.196.21
  63 61.247.196.24
  92 61.247.196.25
  82 61.247.196.26
 111 61.247.196.27
 105 61.247.196.28
  42 61.247.196.29
  72 61.247.196.30
  89 61.247.196.31
 100 61.247.196.32
 113 61.247.196.33
 112 61.247.196.35
  84 61.247.196.36
  78 61.247.196.37
  64 61.247.196.38
 100 61.247.196.39
  56 61.247.196.40
 105 61.247.196.43
  90 61.247.196.44
 118 61.247.196.46
  69 61.247.196.47
  97 61.247.196.48
  96 61.247.196.49
  98 61.247.196.50
  80 61.247.196.51
  81 61.247.196.53
  56 61.247.196.54
  83 61.247.196.55
  55 61.247.196.56
 107 61.247.196.57
  97 61.247.196.58
  74 61.247.196.59

おおすぎー ^^;; 先頭の数字は昨日1日ぶんのアクセス回数です。ぱっと見、61.247.196.*からの ようですからそのように指定しても いいですが、それだとNaverが使うIPアドレスをぜんぶ網羅できていないかもしれませんね。ここはひとつ、IPアドレスの割当をちゃんと調べてみましょう。whois してみます。


% whois 61.247.196.58
...(中略)...
inetnum:      61.247.192.0 - 61.247.223.255
netname:      NHN-NET
descr:        NHN
country:      KR
...(以下略)...

NHNっていうのは、Naverを運営している会社の名前です。61.247.192.0 - 61.247.223.255の範囲がNHNに 割り当てられていることになっていますね。念のため、参考文献[1]をみてみます。ここでは国別の割り当てIPアドレスリストがぜんぶみられます。便利ですね。韓国のリストを見ると、上記に該当するのは「61.247.192.0/19」これですね。これをまるごとNHNがもらってつかってるみたい。ですから、 css/.htaccessに次のように書きます。


order allow,deny
allow from all
deny from 61.247.192.0/19

さらに本体のアクセスも制限しちゃう。本体にアクセスに来ているのは以下のIPアドレス。


 717 61.247.217.33
 673 61.247.217.34
 637 61.247.217.35
 663 61.247.217.36
 685 61.247.217.37

同じように、先頭の数字は昨日1日のアクセス回数です。こっちはぜんぶ禁止にするのは つまらないので(?)、5兄弟の4人だけ禁止にしちゃう。/ の .htaccessにこう書いておく。


# reject naver kids
order allow,deny
allow from all
deny from 61.247.217.33
deny from 61.247.217.34
deny from 61.247.217.35
deny from 61.247.217.36

これで有効なページ読み出し回数が1/10になるはず。ただアクセスそのものがなくなるわけじゃなくて、 アクセスに対して403(Forbidden)が返却されるようになるだけなので、Yetiさんが気にせず読みに きまくったらログ上はうざいことには変わりないですね。ただ、 例のサイトはアクセスされたページをDBにキャッシングして いるので、あまりガンガンアクセスにこられてもこまっちゃう。あんまりアクセスがないのも困るけど。 その点からは1/10ぐらいで丁度いいかも ^^;

参考文献

  1. Blackholes.us

Saturday, July 28, 2007

そうめんの研究: 半田そうめんは太くてうまいぞ

梅雨もあけてすっかり夏ですね。夏にはそうめんがうまいです。いつもは地元岡山のそうめんか、小豆島のそうめんを食べているんですが、ことしは友人に「半田そうめん」というのを教えてもらいました。これがその半田そうめん。「竹田製粉製麺工場」というところのものです。

handa tenobe soumen

写真1. 半田手のべそうめん

徳島県美馬郡つるぎ町(旧半田町、つるぎ町は一宇村・貞光町・半田町が合併して平成17年3月1日発足)で作られているもので、200年の伝統を誇る。そうです。これがそうめんとは思えないほど太い。食べているとうどんかと思うぐらいです。そして、しかし、かなりうまいんです。というわけで、いったいどれぐらい太いのかほかのそうめんやひやむぎとくらべて調べてみることにしました。

今回買ってきたうどんとひやむぎとそうめんたち。いろいろな産地、いろいろな生産者のものが売られいていましたが、今回は地元岡山の業者をリスペクトして「かも川」のものを中心に買ってきました。左から、かも川手延うどん、かも川手延細うどん、かも川手延ひやむぎ、かも川手延そうめん、小豆島の「島の光」手延素麺、それから半田手のべそうめんです。

udon hiyamugi soumen

写真2. うどん、ひやむぎ、そうめん

さっそく1ぽんづつとりだして、ならべてみました。ついでにノギスで太さを計測。断面が円形ではないので、長いところと短いところを測ってみました。ついでに長さも物差しで計測。ならび順は上のパッケージの写真とおなじです。

うどん比較

写真3. めんの太さ比較(数字はめんの断面の太さ(mm)とめんのながさ(cm))

こうして見ると、半田そうめんは、かも川のひやむぎと同じぐらいですね。一体どうなってるんでしょうか。現在の日本農林規格によると、機械製麺のばあい、そうめんは断面の直径が1.3mm未満、ひやむぎは1.3〜1.7mm未満、うどんが1.7mm以上、という区別になっているそうです。機械ではなく「手延べ」の場合は、1.7mm以上が「手延べうどん」、1.7mm未満は「手延べそうめん」または「手延べひやむぎ」となっており、手延べにかぎっていえばそうめんとひやむぎに区別はないことになります(参考文献[1])。

しかしこの規格が制定されるにあたっては紆余曲折があり、参考文献[1]に「2004年に手延べそうめん類の日本農林規格及び品質表示基準が廃止され、新たに手延べ干しめん日本農林規格(特定JAS)が制定されました。品質表示基準は従来の機械麺の乾めん類品質表示基準に統括されました」とある通り、2004年に手延べそうめんに関する規格が改訂されています。規格が改訂されるにあたって、2002年ごろに農林水産省から、「新規格では半田手のべそうめんは『半田ひやむぎ』になる予定です」という話が旧半田町にあったそうです(参考文献[2])。ポイントはふたつあって、まずは太さ。旧規格は今の機械製麺のとおなじでそうめんは1.3mm以下となっていたため、新規格でもそれを踏襲しようとしていたようです。半田そうめんは1.3mmよりふとい! そうめんじゃなくてひやむぎになる! 半田そうめんピンチ! それからもうひとつは「手のべ」の表記。旧規格では、小麦粉を練ってよりをかけて引き延ばし、熟成したものを「手延べ」としていたのだが、新規格の改正案では「小引き」と「庭干し」と呼ばれる部分が手作業でないと「手延べ」と呼べないことになっていた。「小引き」というのは「よりをかけて引き延ばす」行程。いまではこの行程でほとんどの業者が機械の補助を使っているため、このまま改正されると「手延べ」とはいえなくなってしまう。ピンチ!

しかし伝統的な「手延べ」を守るために作られる規格のせいで、伝統的に「手延べそうめん」と名乗っていた半田手のべそうめんが名前を変えざるを得なくなるとすれば、かなりおかしなことだといえましょう。そんなわけで、「手延べ」に関しては太さは1.7mm以下であればそうめんとも、ひやむぎとも名乗ってよいことになったので、半田そうめんもどうどうとそうめんを名乗れることになったのです。よかった。パチパチ。

ほっとしたところで、さっそく、たべくらべてみた。「半田そうめん」は、こしがあり、うどんのようなかんじです。うまいね。ほかの「そうめん」はぜんぜんちがうので、半田そうめんと太さが似ている「かも川ひやむぎ」をたべてみます。これも、やはりおなじようにいい感じのこしがあります。しかしかなり食感が半田そうめんとは違う。むしろ「かも川細うどん」のほうが半田そうめんと似た印象をうけました。半田そうめんをたべた第一印象の「うどんのようなかんじ」はまちがっていない。なぜだろう、とモグモグしながら考えたのだが、どうも、太さとめんの長さにひみつがありそうだ。

「かも川細うどん」と「ひやむぎ」、「半田そうめん」のめんの断面の短い直径のほうは約1.4mmでほぼ同じです。長いほうの直径と、めんの長さの比をとってみると、

  • かも川細うどん: 250/2.25= 111
  • かも川ひやむぎ: 250/1.55= 161
  • 半田そうめん: 180/1.70= 105

「半田そうめん」と「かも川細うどん」の数値が似ています。おそらくこれが食感に影響し、似たような雰囲気を醸し出しているのではないだろうか。今回は時間がなくて実施できなかったが、この仮説を検証するために、「かも川ひやむぎ」の長さを18cmていどに切ってゆでてみるという実験をする必要がある。

しかし、私の実家は愛知県なのですが、こどものころ食べたひやむぎは、こんなにこしがなかった気がする。このあたり(西日本)のそうめん(とひやむぎ)はうまいなあ。今度実家に帰ったら愛知県のひやむぎも比較してみることにしよう。

なお、「竹田製粉製麺工場」のそうめんは通販可能です。webで通販しているところもありますが、友人曰く、直接注文するのがいちばんお得、とのこと。Webサイトは無いようなので、電話して注文してください。竹田製粉製麺工場 電話:0883-64-2020。

参考文献

  1. そうめんとひやむぎ事情
  2. おはようとくしま 「そうめん」か「ひやむぎ」から どうなる半田手延べそうめん,四国放送,2002

Friday, July 27, 2007

yetibotの再来

先日の記事を書いてrobots.txtを設定したあと、ぱったりこなくなっていたyetibot@naver.comさんですが、robots.txtの制限を外しておいたかいあって(?)、25日の朝9時頃から活動を再開したようです。例のサイトへのアクセスが25日の朝9時から26日の朝3時までで4247アクセスでした。そのうち約半数の2125アクセスがcssファイルです。例によって。

今回はいろいろ実験してみたいので、素直にはじくのはやめて、robots.txtに次のように書いてみました。


User-agent: Yeti
Disallow: /css/
Disallow: /img/
Crawl-delay: 180

User-agent: Baidu
Disallow: /css/
Disallow: /img/
Crawl-delay: 180

User-agent: *
Disallow:

Crawl-delayはA Standard for Robot Exclusionには含まれていないようですが、ask.comやYahoo!のボットはサポートしているようです。参考文献[2]によるとYetiさんはCrawl-delayを理解できないようですが、まあいちおうわたしも試してみたいので、書いてみました。あとはcssを毎回(!)読みにきてうるさいので、これも禁止に。イメージファイルは読みにきてはいないけど、念のため。

ついでに(?)Baiduさんも指定してみた。現在のところ、Baiduspiderさんはコンスタントに2分に1アクセス、1時間に30回x24時間=720アクセス程度の「良識的」アクセスです。とりあえず間隔を3分にしてもらえるかどうかテストのため加えてみました。

さあどうなるかなー?

参考文献

  1. A Standard for Robot Exclusion, robotstxt.org
  2. 噂のBaiduとNaverのクローラはwikiがお好き, blog@browncat.org, 2007

Wednesday, July 25, 2007

NHKスペシャル「グーグル革命の衝撃」にでてくるお兄さんはだれ?

今年の1月にNHKスペシャルで「グーグル革命の衝撃」という番組を放送していました。わたしは録画してみたのですが、まあなんというか、番組自体はNHKっぽい予断あふれる無難な構成で、あまり面白くありませんでした。

その中で、大学を出たけど就職活動もしないでアドセンスからの収入でくらしているというお兄さんが出てきます。「今月送られてきた小切手さ」といって$7500ぐらいの小切手をみせてくれます。これをきゅうに思い出して、どういうひとで何のサイトなのかなー、としりたくなったのでちょっと調べてみた。画面で見た感じでは携帯電話のサイトみたいだったけど。

で、お兄さんのジョナサンゲールズさんのページ。えらく簡素ですが、Aboutをみると、携帯電話のサイトはMobile Trackerというやつみたい。もっとカタログチックなサイトかと思ったら、そうでもなくてブログみたいな感じですね。alexaのトラフィックランクで70,000位ぐらい。あと、アドセンスがついていそうなサイトはMac MercというMacのサイトで、トラフィックランク17万位。これぐらいみたいだけど、これでアドセンスの広告料月7500ドル? うーん。

参考文献

  1. Mobile Tracker
  2. Jonathan Gales

RARをMac OS Xで展開する

「学会で知り合ったひとがRARという拡張子のファイルを送ってきたが、見られない」とのことで、調査してみた。RAR(ラー)っていうのは、「可逆ファイル圧縮形式の一つ。Eugene Roshal氏が開発した「RAR」「WinRAR」などのアプリケーションで使われていた形式」(参考文献[1])とのこと。まあ普通こんなの使わないで、tar+gzだよね。でも自分では使わなくても、送ってこられた場合には見られると便利なこともある。ちなみにアーカイブは解凍じゃなくて、展開だと思う。だって凍ってないし...

rar-icon.jpg

図1. STUFFIT EXPANDERのRAR書類アイコン

Mac OS Xでrarアーカイブを展開するには、Mac OS X版RARとかもあるみたいなんだけど、まあ普通に「STUFFIT EXPANDER」でいいでしょう。ほかのソフトは必要ありません。むかしのSTUFFIT EXPANDERはrarが展開できなかったようですが、2003年からはバッチリサポートしています。ちなみにSTUFFIT EXPANDERは老舗の展開ソフトで、以前はMacにバンドルされていたような気もしますが、最近はバンドルされていないみたいですね。上のURIで名前とemailアドレスを入れて「SUBMIT」ボタンをクリックします。そうするとダウンロードのURIが書いてあるメールが送られてくるてはずになっております。ここでいれたメールアドレスにはあとで広告を送ってくるので、面倒なひとは10 Minute Mail (10分だけ有効な無料のメールアドレス) を使うといいでしょう。送られてくるURIをポチッとすると、ダウンロードのページにとびます。おそらくいきなりここに行ってもダウンロードできるんじゃないかな? 試してみたひとは結果を教えてください。

このダウンロードのページはずいぶんごちゃごちゃしててみにくくなりましたが、「Expander 2009」を選んで「DOWNLOAD NOW」をおせばOKです。2007年現在の最新版は12.0.1でしたが、2008年12月現在の最新版は「2009」になっております。

Stuffit Expander Download

図2. ダウンロード

ダウンロードしたものはdmgファイルなので、開いて、インストーラーを実行すれば「STUFFIT EXPANDER」がインストールされます。

Stuffit Expander installer

図3. インストーラー

あとはrarファイルをダブルクリックするだけで展開することができます。便利ですね!

(2008/12/24: URLおよびバージョンの変更に伴い修正)

参考文献

  1. IT用語辞典 e-Words
  2. 10 Minute Mail
  3. STUFFIT EXPANDERのダウンロード

Monday, July 23, 2007

いまから鳥取へ出発

いまから鳥取に行ってきます。6時間ぐらいで戻る予定。10:25分出発。

まず岡山県内を北上。

DSCF5170.JPG

途中にある久賀ダム。

DSCF5176.JPG

鳥取側へ抜けたところ。智頭あたり。

DSCF5178.JPG

千代川沿いをさらに北上。

DSCF5179.JPG

今日の目的はこれ。戸籍抄本。パスポート更新用です。450円也。鳥取市役所の駐車場にて。13:45ごろ。

DSCF5182.JPG

鳥取市内を南下。

DSCF5186.JPG

鳥取にもモルモン教。白人の男の子ふたり組で、自転車にヘルメットで、白いシャツに黒いズボン という、かならずおなじかっこうしてるのはなんで? ていうかジャケットはどこ?

DSCF5188.JPG

鳥取は風の谷だった!

DSCF5191.JPG

もう津山市内。

DSCF5192.JPG

大学に到着。16:30分。すべて込みの往復時間は6時間5分でした。ツカレタ...


Sunday, July 22, 2007

System Profiler をコマンドラインで

Mac OS XにSystem Profiler.appというソフトがあります。Applications/Utilities/System Profiler.appにありますので、ここからでも起動できますし、その他にもアップルメニューの「About This Mac」で出てくるウインドウ(写真1)で「More Info...」ボタンを押しても起動します。

Mac OS X 10.4.10 comes here

写真1. About This Mac

System Profilerが起動するとこんな感じです(写真2)。

system_profiler.jpg

写真2. System Profiler.app

マシン名やモデル、CPUの数、メモリの量などいろいろなことが分かって便利です。ただ、これは ふつうのアプリケーションなので、リモートからネットワーク越しに情報をみるのがむつかしいですね。 これをコマンドラインでとれると便利かもしれない。そういうのないのー、とおもって調べたら、 ありました。その名も"system_profiler"。フルパスでいうと /usr/sbin/system_profiler です。

使い方ですが、指定するのは2つだけ。出力フォーマットと、とる情報のタイプです。出力 フォーマットのほうは、なにも指定しなければインデントで成形されたプレインテキストで 出てきます。オプション"-xml"をつけるとXMLで出てきます。

取得する情報のタイプは、指定しなければ全部の情報がとれます。うちでは1108行も出てきました ^^; 引数として"dataType"を指定すると、そのセクションだけ情報をとることができます。dataTypeには たとえばSPHardwareDataTypeなどがあります。可能なdataTypeの一覧はオプション"-listdatatypes"を つけると見ることができます。データタイプの一覧はうちではこんな感じでした。


Available Datatypes:
SPHardwareDataType
SPNetworkDataType
SPSoftwareDataType
SPParallelATADataType
SPAudioDataType
SPBluetoothDataType
SPDiagnosticsDataType
SPDiscBurningDataType
SPFibreChannelDataType
SPFireWireDataType
SPDisplaysDataType
SPMemoryDataType
SPPCCardDataType
SPPCIDataType
SPParallelSCSIDataType
SPPowerDataType
SPPrintersDataType
SPSerialATADataType
SPUSBDataType
SPAirPortDataType
SPFirewallDataType
SPNetworkLocationDataType
SPModemDataType
SPNetworkVolumeDataType
SPApplicationsDataType
SPExtensionsDataType
SPFontsDataType
SPFrameworksDataType
SPLogsDataType
SPPrefPaneDataType
SPStartupItemDataType

うちではこうでしたが、マシンやOSによってちがうかもしれません。で、うちのマシンのプロファイルはというと、こんな感じ。実行したコマンドは"system_profiler SPHardwareDataType SPSoftwareDataType"です。


Hardware:

    Hardware Overview:

      Machine Name: PowerBook G4 15"
      Machine Model: PowerBook5,2
      CPU Type: PowerPC G4  (1.1)
      Number Of CPUs: 1
      CPU Speed: 1.25 GHz
      L2 Cache (per CPU): 512 KB
      Memory: 2 GB
      Bus Speed: 167 MHz
      Boot ROM Version: 4.7.1f1
      Serial Number: V740395ENRX

Software:

    System Software Overview:

      System Version: Mac OS X 10.4.10 (8R218)
      Kernel Version: Darwin 8.10.0
      Boot Volume: Macintosh HD
      Computer Name: xxx
      User Name: xxx

一部伏せ字にてお送りしております。15インチのPowerBookなのと、そのモデルが"PowerBook5,2"と いうのがわかりますね。せっかくネットワーク越しでもとれるので、学校においてあるiMacのプロファイルもとってみた。


Hardware:

    Hardware Overview:

      Model Name: iMac
      Model Identifier: iMac4,1
      Processor Name: Intel Core Duo
      Processor Speed: 1.83 GHz
      Number Of Processors: 1
      Total Number Of Cores: 2
      L2 Cache (per processor): 2 MB
      Memory: 2 GB
      Bus Speed: 667 MHz
      Boot ROM Version: IM41.0055.B08
      SMC Version: 1.1f5
      Serial Number: W86030YBU2R

Software:

    System Software Overview:

      System Version: Mac OS X 10.4.10 (8R2218)
      Kernel Version: Darwin 8.10.1
      Boot Volume: Macintosh HD
      Computer Name: xxx
      User Name: xxx

こうしてみると、Intel用のと、PowerPC用のとでMac OS Xのバージョンもびみょうに違うし、カーネルもマイナー番号が違うんだなあ。へー。というわけでみなさんもプロファイルをとってみよう!

参考文献

  1. man 8 system_profiler, 2003

Friday, July 20, 2007

Graphic Converterのダイアログの日本語はイマイチ

Lamkesoftという会社のGraphicConverterというソフトがあります。「Photo Editing」のためのソフトで、まあPhotoshopと似たような目的のソフトです。 PowerBook G4には本体にバンドルされていて無料で使えて、そこそこ便利に使っていたんですが、 Intel iMacにはついてこなかったので、自分でインストールして使っていました。 25 euroの有料ソフトですが、お金を払わなくても試用可能です。ただし、お金を払っていない場合は、 起動時にダイアログがでて、30秒待たなくちゃいけない。これがそのダイアログ。

GraphicConverter Dialogue in English

1992年からとはまた古いですね。私が初めてMacを買ったのは1993年の春でしたが、それより古い。そんなころにあったかなあ...ぜんぜん知らなかったね。

ダイアログそのものはまあとくにどうということもなく、よくあるふつうのものですね。これは英語版ですが、これとは別に日本語版もある。日本語版とか英語版とかじゃなくて、配布物はひとつで、System Preferences -> International で選ばれた言語で表示するようにすればよさそうなもんだが、いまのところ言語別のバージョンを配布中だ。そして、OSの言語が英語でも、日本語版はメニューが日本語ででます。OSの言語が日本語でも、英語版は英語でメニューが表示されます。そして、これがその日本語版のダイアログ。

GraphicConverterダイアログ日本語

なんかつっこみどころが...

  1. 「著作権」?
  2. 「(c)」?
  3. 「試用バージョン」?
  4. 450日「も」つかわれています

順番に見ましょう。(1)の「著作権」と(2)の(c)。英語版はCopyrightと©です。この表示は、自動的に著作物の著作権が認められる「無方式主義」の国(日本など)の著作物が、公的機関や公証人などにより著作物を登録をして初めて著作権が認められる「方式主義」の国で(1989年以前の米国など)、その国の方式にのっとって登録されていなくても著作権が認められるために表示するマークです(参考文献[1])。©がでる場合は©を使い、技術的に困難な場合(そういう文字がないなど)は(c)という表記でもいいということになっています。Macの場合©は出せるんだから、©をつかえばいいのに、なんで(c)をつかってるんだろう? 「Copyright」の方は©表示があればそれだけでよく、「Copyright」という表記はあってもなくてもよい。つまりオマケみたいなもん。だから「Copyright」でなくて「著作権」と表記してあっても良い。しかし上記の©を表示する理由から考えて、わざわざ「Copyright」を「著作権」と日本語にする意味はあるんだろうか? 日本人向けに書いてるんだろうか?

つぎに(3)の「試用バージョン」。これはよくない。英語版は「Try it」(試用する、試す)となっています。ほかのふたつのボタンは「購入する...」「コードを入力する...」と動作を表す表現になっているのに、なぜかここだけ「試用バージョン」。試用バージョンを「ダウンロードする」のか「試用する」のかわからない。わざわざここだけ変な訳にすることないのに。

(4)の『このソフトウェアは既に450日もつかわれています!』。英語版は「You've been using this software for 450 days!」。「既に」とか「も」とかいうニュアンスはないだろ...もっとふつうに訳せんのか! 日本語の方は「既に」450日「も」使ってるんだから、いいかげん買ってくださいよー、というふうにきこえますね。とてもなれなれしく、そしてたいへん貧乏くさい。

他にも「!」じゃありませんよ、とか、「文書による許可云々」の文がへんですよ、とか、いろいろありますね。というわけで直してみた。勝手に!

GraphicConverterダイアログ日本語修正版

だいぶましになった。しかしこの日本語版、だれが訳したんだろ? ほかのところの翻訳はみてないけど、このぶんだとそっちも怪しそうだなー。

参考文献

  1. 著作権と「マルC」

Thursday, July 19, 2007

blogger + feedburnerにリダイレクトでgoogle sitemapがおかしくなる件

blogger.comでフィードをリダイレクトできるようになったというので(参考文献参照)、わたくしもさっそく設定しました。 はじめはfeedburner.comを使ってたのですが、「日本語が化けることがあるよ」という話をコミミにはさんだので、feedburner.jpに変更しました。うまくいってるかんじ。シメシメ。フィードを何人ぐらい読んでるかわかるし、いいよね。

しかし、今日、何気なく見てみるとgoogle sitemapでエラーが出ている。

sitemap-error.jpg

燦然とカガヤクERRORの赤文字。うーん? エラーの内容はというと、

Line: 2
URL not allowed
This url is not allowed for a Sitemap at this location.
URL: http://feeds.feedburner.jp/iwatakenichi?m=26
Date found: Jul 18, 2007

こんなかんじ。blogger.comはサイトマップを作ってくれないので、サイトマップのかわりにフィードをgoogle webmaster toolsに送っているのだ。そのフィード代わりに使っているサイトマップが、blogger.comが提供するものからfeedburner.jpが提供するものにかえたらエラーが発生。どうも記事についているURLがちがうのがいけないらしい。feedの記事をクリックしたときに、feedburner経由にさせて、どれがクリックされたかみるための機能があり、そのために記事のURLがfeedburnerになっている。これがblogspot.comのままじゃないといけない。そういえばなんかそんな機能をONにした記憶が...

どこでOFFにするんだ! これしばし悩みました。Feedburnerの「設定」みたいなところかなーとおもうでしょう。そこじゃないのよ。大変フクザツなので(おおげさ)写真で説明いたします。

feedburner01.jpg

まず該当するフィードの「レポート」を見ている状態で左に出ている「サイト集計」というリンクを押します。そのあと右に出るダイアログみたいなのの中の「いますぐサイト集計機能を有効にしましょう」というリンクを押します。左の「サイト集計」の下あたりに出ている「ここから設定することができます」も似ていますが、これではありません。

feedburner02.jpg

そうしたら右に設定のダイアログが出ますので、「記事クリック数(クリックスルー集計)」をOFFにします。そして、したの「保存」ボタンを押す。これで完了です。もし、この画面がでなくて、

feedburner03.jpg

こっちの画面になっちゃった方は、左の「ここから設定することができます」を押しちゃったひとです。まちがい! 似てるけど、こっちは有料版の機能の設定みたいで、これを「保存」するとクレジットカードいれてください、とかでてきちゃいます。上に戻ってやり直してくださいねー。

参考文献

  1. FeedBurner Integration for Blogspot Blogs, Burning Questions - The official FeedBurner weblog, 2007
  2. Blogger から FeedBurner へのリダイレクトが可能に, クリボウのBlogger Tips, 2007

webクローラーのUser-Agent一覧

このところうちに来ている/来たことのあるwebクローラー(とおもわれるもの)のUser-Agentを一覧表にしてみました。具体的にはrobots.txtを読みにきたひとの一覧です。期間は2007/6/26〜7/18まで。

  1. "Baiduspider+(+http://www.baidu.com/search/spider_jp.html)"
  2. "Gigabot/3.0 (http://www.gigablast.com/spider.html)"
  3. "Googlebot-Image/1.0"
  4. "JS-UZUSHIO"
  5. "Mozilla/2.0 (compatible; Ask Jeeves/Teoma; +http://about.ask.com/en/docs/about/webmasters.shtml)"
  6. "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
  7. "Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)"
  8. "Spock Crawler (http://www.spock.com/crawler)"
  9. "SurveyBot/2.3 (Whois Source)"
  10. "Yeti/0.01 (nhn/1noon, yetibot@naver.com, check robots.txt daily and follows it)"
  11. "ia_archiver"
  12. "ia_archiver-web.archive.org"
  13. "msnbot/1.0 (+http://search.msn.com/msnbot.htm)"

(1)のBaiduspiderは百度のクローラー。中国のサーチエンジンで、2003年に急成長し、2004年からalexaのトラフィックランクで世界の10位以内に入っている。現在は7位。もうすぐ日本でもサービスインするらしく、その前に日本語のページを集めているようだ。かなり積極的なアクセスで物議を醸したようだが、うちでは目立った動きはない。

(2)のGigabotはgigablastのクローラー。アメリカのサーチエンジン。登録型のディレクトリもある。トラフィックランクは2万位台とたいしたことはない。

(3)はGoogleのイメージ収集用?

(4)のJS-UZUSHIOはよくわからない。けっこうあちこちアクセスに行っているようですね。robots.txtを読んだあと、1ページだけ他のページを読むと言う動作をします。うちには2回しか来ていません。ODNのppp接続ホストで動いている上、他のサイトのアクセスログをみると、IPアドレスもひとつだけのようです。個人のもの?

(5)はAsk.comのクローラー。日本語版はask.jp。ask.jpのクローラーもこれと同じかどうかは不明(未調査)。ask.comについてはAsk.com(wikipedia)を読むと良い。

(6)はGoogleのクローラー。

(7)はYahoo.comのクローラー。Slurp(スラープ)というのは英語で「くちゃくちゃたべる」という意味で、2002年末に米Yahoo!が買収したinktomiサーチのクローラー名です。たぶんYahoo!JAPANもおなじUser-Agent名かなと思うが、これはhttp://help.yahoo.com/help/us/ysearch/slurpとかいてあるから、アメリカのYahoo!のクローラーかな。

(8)はSPOCKのクローラー。SPOCKは「人」に特化したサーチエンジンで、人名や、ひとのグループをさすような単語を入れて検索するらしい。たとえば「スピードのメンバー」とか? (いまは英語だけみたいですが)。 PC Worldの2007年6月の記事25 Web Sites to Watchにも選ばれたそうです。いまはベータサービス中で、登録したひとしか使えないみたい。あとでためしてみたい。

(9)はWhois Sourceのクローラー。ドメイン名を入れるといろいろ情報が出てくる。高機能版のwhoisみたいなかんじ。こんなのしらなかったな。けっこう面白いなあ〜。旧名はDomainToolsというらしい。詳しくはInformation about Survey Botにあります。

(10)はみんなの人気者Yeti、Naver(ねいばー)のクローラーです。最近きてくれないわー。

(11)はalexaのクローラー。alexaはアメリカの視聴率調査会社で、インターネットの視聴率調査(トラフィックランキング)もやってます。いまはアマゾンの子会社らしい。リンクをフォローするだけじゃなくて、可能ならディレクトリのインデックスをとってどんどん掘ってるっぽい。他の人がアクセスにこないようなディレクトリにもやってきます。

(12)はwebサイトのタイムマシンwaybackmachineのクローラーみたい。こんな泡沫サイトまで来てくれるなんてほんとやさしいのね ^^;; (まだインデックスはされてないみたいでしたが)。

(13)はMSNのクローラー。

こうしてみると、けっこうありますね。でもYahoo!JAPANaltavistaとかにはおいでいただいていないのね。gooにもおいでいただいてないけど、gooで検索したひとが飛んでくるなあ...とおもったらgooは2003年10月にGoogleと契約して、Googleのエンジンつかってるみたい。ナルホドネ...


Wednesday, July 18, 2007

Bloggerに検索ボックスをつけてみた

blogger in draftに検索のウィジェットが追加になりましたので、さっそくわたしもつけてみました。左に出ているのがそれです。たとえば「gparted」と入力して検索すると、このブログでGpartedのことをかいている2つの記事が、タイトルの下あたりににゅっと出てきます。

search widget on blogger in draft

結果が表示されるとタブが4つ表示されます。「This Blog」、「Linked From Here」、「Links」、「The Web」の4つです。「This Blog」と「The Web」の説明は必要ないとして、「Linked From Here」は、このブログのポストからリンクした先を検索するものだそうです。「Links」タブは、Linkウィジェットからリンクしているサイトを検索するもの。このブログだと「Links」ウィジェットは左に置いてあります。

いまのところ、「This Blog」タブと「The Web」タブは動いているようですが、 「Linked From Here」と「Links」タブはまだみたいです。Googleが情報をあつめたら使えるようになるのかな? まだdraftサービスだからうまく動いてないだけかも... ^^;;

追加の仕方は簡単です。まずblogger in draftからログインする。そうするといつものDashboard画面がでるので、そこから「レイアウト」を押してレイアウトの変更をするだけ。draftは、betaのときみたいに「移行」する必要はなくて、単にdraftからログインすれば使えるみたいです。便利ですねー。

参考文献

Tuesday, July 17, 2007

Fastladderの英語がアレな続き

光速をこえたRSSリーダーFastladderの英語がアレな件です。今日はセッションが切れると出るダイアログの文。


You need to sign in to Fastladder
Please reload the browser and sign in again

「You need to sign in to Fastladder」なのはいいけど、「どうして」が抜けています。「reload the browser」もよくわからないかんじ。

  1. 現象: we can't process your request.
  2. 理由: the session timed out.
  3. 対処法: press "reload" button on your browser and sign in again.

まとめると


SESSION TIMED OUT.
Please press the "reload" button of the browser and sign in again to continue.

こんなのでどう?


Monday, July 16, 2007

blogspotのrobots.txtが変更された件

昨日気がついたんですが、bloggerのrobots.txtが変更になりました。参考文献[1]でも指摘されています。

[旧]
User-agent: *
Disallow:
[新]
User-agent: *
Disallow: /search
Sitemap: http://iwatakenichi.blogspot.com/feeds/posts/default?orderby=updated

変更点は(1)/search以下のクロールが禁止になった(2)サイトマップがついかされたの2点ですね。/search以下というのは、ラベルでの参照に使われているようです。たとえばラベル「計算機」の記事の一覧ですね。あとは年のアーカイブが/searchから始まっています。たとえば2007年の記事一覧などですね。月ごとのアーカイブのURLは違っているので(例:2007年7月のアーカイブhttp://iwatakenichi.blogspot.com/2007_07_01_archive.html)ので関係ありません。ラベル別のページや年のアーカイブページまでインデックスすると、本来の記事のページとあわせて2重3重にインデックスされることになるので、除外する事にしたのかな?

サイトマップのほうは、Googleウェブマスターツールを使って送信するサイトマップとおなじものが指定されています。ウェブマスターツールで送信しているのと同等になるのかな? とおもったが、そうでもない、という意見もあります(参考文献[2])。私は試していません。

いずれにせよこのblogger上のrobots.txtはユーザーがいじれるものではなく、それどころか実在のファイルではないらしく(スクリプトで送信しているらしい、そりゃそうか)、ユーザーサイドでは「あれー、かわってる」と思うぐらいで、とくに何ができるというものではなさそう ^^;

参考文献

  1. Google Webmaster Help , 2007
  2. Blogger Blogs have Robot.txt file, 2007

Sunday, July 15, 2007

パウンドケーキを作った

今日のバザーで売るためのパウンドケーキを焼きました。作り方は簡単です。今回も以前書いたレシピで作りました。これだと卵は黄身と白身をべつだてするので、すこし面倒だけど失敗が少ないくていいです。

バターを立てるところはいつもどおり手でやりましたが、メレンゲはブラウンのマルチクイックをつかって作りました。かなり楽ですね。今回は3本いっぺんにつくったので、卵6個分の卵白をメレンゲにしたのです。手でやったら結構たいへんですが、マルチクイックを使うとあっという間です。というほどでもないけど、数分? これはもう、やめられないマルチクイック ^^;;


Saturday, July 14, 2007

ブラウンマルチクイックプロフェッショナルを買ってみた

昨日、急にミキサーが欲しくなり、どれにしようかとアマゾンでみていたところ、IRCで「これがいいよ」とそそのかされて買ったのが「ブラウンマルチクイックプロフェッショナル(MR 5550 M CR)」。ついでにアマゾンプライムにも加入してしまった...というわけで昨日の午後注文を入れて、本日の午前中に届いた。

Braun Multiquick professional

これが箱。結構でかい。となりのバナナと比べてください。

inside the package

箱のなかみ。紙1枚の説明書と、レシピブック、それから本体と「ブレンダー」、「チョッパー」、「泡立て器」、それから専用計量カップとそのフタ、壁掛けホルダーです。結構大胆なパッキング。日本の製品だったらもっとうまいことしてちいさい箱に入れそうなかんじ。ではさっそく、「ブレンダー」をつかって、すももシェイクを作ってみます。

DSCF5154.JPG

材料はすもも(写真の品種はソルダムです)が3個、砂糖大さじ1杯、ヨーグルト、牛乳です。専用計量カップじゃなくて、汎用計量カップ(50dl)をつかいます。

DSCF5155.JPG

すももは皮ごと適当な大きさに切って計量カップに入れます。種だけ除くかんじで。皮はむいてもいいですが、皮のすぐしたの身がうまいので、むかないほうがおいしいと思います。この時期、すももはうまいね。初夏の味、すもも! たまりません。

DSCF5156.JPG

すもものはいった計量カップに砂糖大さじ1杯、ヨーグルト適量、牛乳適量を入れます。ここではヨーグルト大さじ3杯程度、牛乳20dlぐらい入れました。量はお好みで。

the blender

ここでブレンダーの先端を見てみましょう。ブレンダーの刃は先端のカバーの中に入っているので、鍋やボウルや計量カップの中で使ってもキズは入らないと思います。ブレンダーのカバー先端の直径は7cm弱です。結構大きいですね。

DSCF5157.JPG

ブレンダーをつけたブラウンマルチクイックプロフェッショナルで混ぜます。使い方は簡単。ブレンダーの先が計量カップの底につくようにして、スイッチを押すだけ。はじめはダイヤルを「3」ぐらいにしてスイッチを入れ、通常回転させて果物をあるていどつぶしてから「ターボ」ボタンで最高回転にしたほうがいいかんじです。最高回転で回転させると、ブレンダーが容器の底に吸い付くようになっています。浮き上がるとあぶないですが、吸い付くようになっていれば安全ですね。結構考えられています。ただ、底に吸い付いちゃうと、下の方しかかき混ざらなくなっちゃう。5秒ぐらい「ターボ」ボタンをおして混ぜ、いったん回転をとめてからブレンダーの先端をつかって全体をかき混ぜるようにする、というのを何度か繰り返したほうがいいですね。全体をおおきく混ぜるようにしないと、おなじところばかりミキサーされちゃいます。

DSCF5158.JPG

ブレンダーを使い始めてから30秒(!)ほどですももシェイクの出来上がり。これは...かなり...うまい! すももは皮ごと使っていますが、皮も気になりませんし、大きく残っている果肉もありません。しばらく楽しめそうです ^^

(2007年8月12日追記)取扱説明書をスキャンしてのせておきましたので、もしよろしければあわせてごらんください。


Friday, July 13, 2007

「RSSリーダーで購読する」ボタンをブログに追加する方法

昨日書いたブックマークレットを使っているひとは、RSSリーダーに購読を追加するのが簡単でいいですが、世の中そういう人ばかりではありません。ブックマークレットをおいていないひとでも、すぐにRSSリーダーに購読を追加できるボタンをあなたのブログにも設置してみよーっ。

create "add to fastladder" button

設置の仕方は簡単。fastladder用のボタンは"Subscribe button"を見て、1. Entry your feed URLっていうところに自分の「ブログのURI」をいれる。このブログの場合は「http://iwatakenichi.blogspot.com/」ですね。そして[Generate HTML]ボタンを押すと、右のプレビュー欄に文字で「Subscribe with Fastladder」というリンクが表示される。これでよければコードを自分のブログにコピペ。アイコンを使いたい場合はURIをいれる欄の下にあるアイコンをクリックして、プレビューがそのアイコンになったのを確認してから、コードをコピペすれば良い。

"add to google" button

google用のボタンは"Add to Google - Information for Publishers"をみて、やはりおなじようにURIをいれる。ただしこちらはブログのURIではなく、フィードのURIをいれる。例えばこのブログだったら「http://iwatakenichi.blogspot.com/feeds/posts/default」といれる。FastladderはブログのURIからフィードのURIを勝手に探してくれるのに、Google Readerはちょっと不便だねー。そして[Create HTML]ボタンを押せばコードが表示されるので、そのコードをブログにコピペすれば完了です。ステキ。


Thursday, July 12, 2007

はてスがポチポチポチポチポチである件について

↑このへんに出ているのが、いまはてな界で話題沸騰中のはてスことはてなスターです。ポチっとするとおほしさまがひとつ増えます。ポチポチとすると2個ふえる。ポチポチポチポチポチのポチポチとすると7個増える。ふふふ。

はてなダイアリーに勝手にくっついて出るようになったらしい。で、表示を消す機能がない。変なもん勝手につけるなー、というはてなダイアリーユーザーの抗議の声が多いようですね。でもー、わたくしもー、流行の波にのりたいっていうかー、とりあえずつけてみました。 付け方は簡単。はてなスターはじめてガイドをよんで、javascriptをブログのどこかにポチッと貼付けるだけ。記事のタイトルの下に出てるでしょ。ふふふ。

「一つのエントリーに対して何個も☆をつけることができます。あなたがブログを読んで感じた「ちょっといいな」を気軽に☆にしてください」とのことなので、ちょーポチポチポチポチして楽しむのだ! たぶん。しらんけど ^^;;

飽きたら外すかも ^^;

参考文献


Fastladderの英語がアレな4つのポイント

fastladder quick guide

光速をこえたフィードリーダー、fastladderですが、なんだか英語があれっぽいので、手始めにログインすると出る「Quick Guide」の訂正案を考えてみた。勝手に!

[訂正案]
Quick Guide
Subscribing your favorite blogs or news.

  • You can add subscription on fastladder.
    1. Click 'Add' icon on the top of the left side.
    2. Enter the URL of the blog you want to subscribe, then fastladder will find you proper feeds for it.
  • The easier way to add a subscription is to install [a browser button](link) in your browser. Get it now!
  • You can also import subscription lists from other feed readers. Export OPML subscription list, and import it to Fastladder.
Reading articles
  • You can read articles by clicking on a blog name at left side one by one.
  • To read articles at speed-of-light, Use keyboard shortcut. You can configure it at keyboard shortcut options.
  • You can mark articles you're interested in and read them later.
    1. Place 'Pin' on an article while you're reading it (by pressing 'P' key or clicking 'pin' icon).
    2. You can read only 'Pinned' articles by pressing 'O' key or click pin icon on the top tool bar.
Managing your subscriptions
  • You can categorize blogs you subscribe by folders.
  • You also can sort your subscriptions by variety of options (e.g. the arrival time of the newest article, title, rating, number of unread items or number of subscribers).
Tips for bloggers
  • Add the 'Subscribe in Fastladder' button on your blog, It will help you to get new readers!
  • Show what you read in fastladder! You can publish your subscription list by configuring 'Manage Sharing' option.

Fastladderの英語が抱える4つの問題点

  1. しなくてはいけないこと「〜してください」と、オプションとしてしてもよい「〜できます」の区別がない。
  2. 目的と手段を関連づけて「〜するためには、〜してください」と書くべきだが、目的(「〜するために」)が省かれている。
  3. 構成の問題。step by stepの解説なのか、それともどれかひとつやればいいのかが不明確。
  4. 基本操作の解説と、発展操作の解説が混ざっていて、どれが基本でどれが発展かわからない。

こうしてみると、なんか英語の問題じゃないようなきもしますね...? ^^;


ブックマークレットのサンプル

Yetiさんは、昨日の記事を書いたあと、ぱったりこなくなっちゃいました。韓国からこのブログになんどかアクセスがあったので、Naverの中のひとが見に来て除外リストにいれるとかの対処をしたのかしら? robots.txtは外しといたのでまたおいでいただけるかも ^^;

で、Yetiさんとは関係ないが、よのなかには「ブックマークレット」って言うのがあるらしい。ブックマークのURIのところにjavascriptで一行プログラムみたいなのを書いておいて、あるページを表示中にそのブックマークをポチッと押すと、なんか動作すると言うようなもんらしい。たとえば、表示中のページを「はてブ」に登録する、とか。そのページのはてブ登録数を表示するとか。そのページをFastladderでsubscribeするとか。そのページに含まれるYoutubeの動画をダウンロードするとか。そのページに含まれるエッチな画像へのリンクをぜんぶダウンロードするとか。しらなかった!

というわけで、ためしに「はてブに登録」ってのをブックマークしてみた。やりかたは左のリンクをみぎクリック(またはコントロール押しながらクリック)してコンテキストメニューを出し、「このリンクをブックマーク...」を押し、「ブックマークツールバー」フォルダーにセーブするだけです。簡単だ。

あるページが表示されているときにブックマークツールバーの「はてブ登録」をポチッとすると、はてブの登録画面になります。ちょっと便利? かな? Fastladderのsubscribeブックマークレットは見つからない。だれか教えてー ^^;

参考文献


Wednesday, July 11, 2007

頭痛に効く薬

以前書いたパラセタモールですが、ほんとは頭痛薬です。そして、今日は頭痛がしています。というわけで、きょうもパラセタモールだ! 今日のんだのは家人にスイスで買ってきてもらったTYLENOL(日本語)。これは「forte」なので、500mg入りです。20錠で4.9スイスフラン=500円ぐらいです。タイの薬局ブランド品よりはたかいかな。でも日本でタイレノール買うと、1000円ぐらいしますからねえ〜。

PARACETAMOL

今日は本当にすごい湿気。これが頭痛の原因のひとつに違いない。この時期から、お盆ぐらいまで、日本は最悪の時期ですよね...6,7,8月はヨーロッパに移住したいね。12,1,2月はタイで、3,4,5月は日本だ。9,10,11月はどこがいいかな?


Naverは客もつれてこないくせに偉そうな顔をして試食品のつまみ食いばかりする観光ガイドだ

例のあわせて検索」ですが、アクセスログを眺めていると、アクセスしてくるのは検索エンジンのクローラーが多いんです。ぐーぐる、yahoo, alexa, MSNにまざって、異様な(?)アクセスパターンで攻めてくるのが「Yeti」。韓国のNaverっていうサイトのボットらしい。User-agentは"Yeti/0.01 (nhn/1noon, yetibot@naver.com, check robots.txt daily and follows it)"。checkなのにfollow"s"なので主語がよくわからんが ^^;; おそらく"we check your robots.txt everyday and follow it"といいたいんでしょうねえ。なんでわざわざこんなところで「ちゃんとrobots.txtよんでますよー」とかいいわけがましいこと言ってるかと言うと、このひと以前はNaverbotという名前で、かなり積極的なアクセスパターンでブツギをカモして、あちこちで出入り禁止になったらしい。それで困って名前かえたのかしら。

アクセスログをgrepしてwcしてみたところ、7月10日のGooglebotのリクエスト数が 897。Yetiは 1887。倍以上です。しかも! YetiさんはYetiさんだけじゃないんです。Yetiさんのアクセスパターンはだいたい以下のような感じ。

61.247.xxx.xx - - [10/Jul/2007:03:02:49 +0900] "GET /robots.txt HTTP/1.1" 404 285 "-" "Yeti/0.01 (nhn/1noon, yetibot@naver.com, check robots.txt daily and follows it)"
61.247.xxx.xx - - [10/Jul/2007:03:02:50 +0900] "GET /words/AAA/BBB HTTP/1.1" 200 8367 "-" "Yeti/0.01 (nhn/1noon, yetibot@naver.com, check robots.txt daily and follows it)"
61.247.yyy.yy - - [10/Jul/2007:03:02:51 +0900] "GET /css/xxx.css HTTP/1.1" 200 2379 "http://saas-sfa.com/words/AAA/BBB" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; SV1; .NET CLR 1.1.4322)"

まず気がつくのは、かなり頻繁にrobots.txtをよむこと。7月10日にrobots.txtがよまれた回数が119回、そのうち104回がYetiさんです。robots.txt占有率 87%。そんなもんがあるとすれば、ですが。"check robots.txt daily and follows it" だから、もういっぱい読んじゃう。ぜんぜんよまないよりマシ? で、どうもうちには5人のYetiさんがきていて、おのおのが1時間に1回robots.txtを読んでるっぽいです。Yeti 5人兄弟。

もうひとつ気がつくのは、毎回cssをよんでいること。なんでわざわざcssをよむ必要がある? ^^; しかも毎回。なんど読んでも同じだよっ! cssなんか読んでなんに使ってんだろ...しかもよみにくるやつのhttp-user-agentが「Yeti」ではない。YetiとはIPアドレスもちがう。

IPアドレスと言えば、逆引きも出来ないのよね。わざとできなくしてるのかな?

あらためて、robots.txtとcssをチェックしているひとも含めて数を数えてみると、Yetiさん関係のリクエスト数は3682回でした。Googleさんの4倍強。よみすぎだろー ^^;

まあとりあえずいちおう仮にYetiさんのことを信用してみることにして、robots.txtに書いてみた。

% cat robots.txt
User-agent: Yeti
Disallow: /

すると、これまたいちおう行儀よく、1時間に5回のrobots.txtのチェックだけになりました...それでもうざい気がするが...

結局、Yeti=Naverのなにが問題かというと、クローラーのアクセス数に見合ったNaver経由のトラフィックがないことじゃないかな? お客さんもつれてこないくせに、試食品のつまみ食いばかりする観光ガイドみたいな? (ちがうか)。Google以上のお客さんをつれてくれば、かなり積極的にアクセスに来ても文句いわれないんだろうけどねー。まあそれはNaverにかぎらず、ほかのクローラーにも言える事ですが。

次回は.htaccessでアクセスそのものを禁止する方法を紹介します! (たぶん)

参考文献


Tuesday, July 10, 2007

mixiの終焉は近い

最近どうもmixiがしずかだな、と思う事が多く、気になったのでalexaでリーチ数を調べてみた。右のグラフがそれです。わたしがmixiをはじめたのは、しらべてみると2004年の6月でした。ちょうどこのグラフの左はじあたりですね。それから2005年中に急成長して、2006年がピーク、そのあと2006年の年末の休み明けの2007年初めと、2007年のゴールデンウイークあけにがくっと落ちてますね。

まあかんがえてみれば、2004年からずーっと「β」。ほとんどシステムがかわってない。いたらないメッセージや画面設計もそのまま。おもな機能追加は「レビュー」「アルバム」「ビデオ」などのSNSの本質とはかんけいのないオマケばかり。株式上場して現金を調達しても「使い道がないので貯金しておきます」などと公言する社長。さすがに、これはあとで訂正したらしいですが ...

そんなわけで、asciiネットや、fjの様にいつかは崩壊する運命にあるmixiですが、案外その時は近いかもしれませんね。


Monday, July 09, 2007

Mac OS X のTextEditがutf-8を判別できない件

ふだんコーディングはEmacsを使っているんですが、印刷ができないので、印刷するときはTextEdit(テキストエディット)を使っています。今日、気がついたんだけど、utf-8で日本語を書いているファイルを普通にTextEditで開くと化けますね。Preferences...でみると、「Open」するときのエンコードがデフォルトでは「Automatic」になってるんですが、これだと自動判別に失敗しているっぽい。「Automatic」から「utf-8」にすると文字化けせずにひらけます。でもねえ、utf-8のファイルばかり扱ってるわけじゃないからこまりますね。せめて、ひらいたあとエンコーティングを変えられればいいんだけど、そういうコマンドはないみたい。ひらいたあとじゃなくて、ひらくときにダブルクリックじゃなくて、File->Open...でひらくようにすると、ファイル選択のダイアログのところで、エンコーディングがえらべます。それもめんどうだし...なんとかなりませんか? ^^;


またwireless mightymouse のボタンが押せない

またもWireless MightyMouseのボタンが押せない。System Preference -> Keyboard & Mouse でみると、電池は 2/5 のこってる。もーなんだ! とりあえず電池かえてみた。電池の蓋を開けるとコネクションが切れるので、電池を入れ替えて、蓋を閉めて、System Preferenceの「Bluetooth」で再認識。これでいつものようになおる。なんだろうなー

丸善の中身がアマゾンに

ちょっと古いニュースですが日経BPnetの2007年06月27日付のニュースで「丸善のオンラインショップのシステムがアマゾンになる」というのがありました。丸善独自のアイテムは追加して、見た目も丸善用にへんこうするが、webのシステムや発送などのしくみはぜんぶアマゾンになるとのこと。丸善にしてみたら、システム開発の費用がかからなくて住むのが利点。欠点はたぶんアマゾンに利益の一部をとられるので、あまりもうからないかもしれない。アマゾンの利点はシステムは(ほとんど)そのままで、注文の取扱量が増えると思われるので、よりもうかる。丸善のweb販売の情報が手に入る(売れ筋など)。欠点はなんだろうね、とくにないかな?

丸善とアマゾンのあいだで、どういう契約になってるのか、興味ありますね。

「外見は丸善、中身はアマゾン」、丸善がオンライン戦略を大転換 --日経BPnet

Sunday, July 08, 2007

すももの品種

「すももももももももものうち」ということばがありますが、すももとももは(もちろん?)違うもののようです。でもおなじ「バラ科サクラ属」の仲間です。梅、杏、サクランボなどもおなじ「バラ科サクラ属」。だから、「すもももももももものうち」というのなら、「すももももももうめもあんずもさくらんぼももものうち」ですね。

すももには中国から伝わった「日本すもも」と、コーカサスが原産でおもにヨーロッパで栽培されてきた「西洋すもも」の大きく分けてふたつがあります。日本では主に生食用に「日本すもも」を、ドライフルーツ用に「西洋すもも」が栽培されているようです。夏にイタリアにいくとよく食後にすももをたべますが、あれは西洋すももなんでしょうね。日本で栽培されている代表的な品種には以下のようなものがあります。

日本すもも

  • 大石早生
  • ソルダム
  • 太陽
  • サンタローザ

西洋すもも

  • サンプルーン
  • スタンレイ
  • シュガー
  • グランドプライズ

日本でよく売られるのは、「大石早生」と「ソルダム」かな。わたしは大石早生のほうがすきです。

参考文献


Saturday, July 07, 2007

桃の品種

岡山は桃の産地で有名です。そろそろ季節なので、果物屋に出回り始めました。しらなかったけど、桃にもいろいろ種類があるようです。

日川白鳳
7月上旬 早生系の代表品種
白鳳
7月上旬 甘く香り良い
清水白桃
7月下旬 実のきめ細かさと甘さと香り
白桃
8月中旬 実が硬いが甘い
川中島白桃
赤い桃硬い肉質で甘い
黄金桃
9月下旬 皮も実も黄・独特な甘みと香り
momo

写真: 白鳳(岡山産)

今ならんでいるのは早生の白鳳ですね。一般に美味とされているのは「清水白桃」です。知人に桃でも送ってやろうと思って果物屋にいき、ならんでいる桃を指して「どれがおいしいですか」ときいたところ「うーん、いまは一種類しかないよ(早生白鳳のこと)」「もうちょっとしたら清水白桃がでるんだけどねえ」とのことでした。白鳳のなかでどれがおいしいですか、という意味で質問したのだが... ^^;

ももならぬすももも果物屋にならび始めてますね。あすはすももの種類について調べることにしよう。今日は、ももじゃなくてすももをかったのだじつは。ちなみにきょうかってきたすももは「オオイシワセ」と「ハニーローザ」でした。

参考文献


「あわせて検索」サイト更新

あわせて検索ですが、いくつか変更しました。

  • 関連キーワードのだぶりを解消しました。
  • カテゴリーや関連キーワードはDBにいれてキャッシュするようにしました。

だぶりのほうは、以前のバージョンでは、たとえば「のり」といれると、あい+のりがふたつ以上表示されていました。これがおきないように変更しました。また、キーワードはDBにキャッシュするようにしたので、今後おもしろい事ができそうです。こうごきたい!


Friday, July 06, 2007

DB serverにSQLでアクセス

以前ちょっとだけ表面をなでた事のあるSQLですが、例のあわせて検索」のためにちゃんとデータベースをつかおうと思って再勉強中です。以前もってたSQLの本は会社を辞めるときにほてぎくん(おーいげんきですかー)にあげてしまったので、今回はネットの資料で勉強しています。「SQLとはなんぞや」「リレーショナルデータベースとはなんぞや」みたいなのは前の本で理解したので、今回はこれでオッケー。

ふつうは大学でデータベース関係の授業があるのかなあ。わたしは「電気情報工学科」ってところだったので、情報関係の講義が少なく、かわりに電気(三相交流!)や電子(電子回路!)や電波(マクスウェルの電磁方程式!)や量子力学(ψのφ!)やらをならったので、データベースはやってません。まあ、あんましあたまには残ってないけど、大学時代はいろいろやったほうが、あとで再勉強するさいの助けになっていいかも。


Thursday, July 05, 2007

のりちゃんのばなな

あるひ のりちゃんは さんぼんの
ばななを やおやで かいました
おっきいばななは とうさんばなな
ちゅっくらいばななは にいさんばなな
ちっちゃいばななは あかちゃんばななよ

あれっ
どんぐり?
どんぐりじゃないよ ばななだよ
ちっちゃくたって、おいしいばなな

ばなな ばなな
かわいいね だいすきよ
のりちゃんの ばなな
ぜんぶのりちゃんの ばなな

© 2007 iwata kenichi


Wednesday, July 04, 2007

ユニクロのポロシャツ

今日は、岡山にしてはめずらしく、しとしととあめがふってていいかんじです。そこで(?)、ひるめしはそばにしました。ぼっこうそば。ざるそばの大盛り(大盛りとは風情がない...)で976円です。

さらに、さいきん夏が近づいてきたので、ちょっとウエストがほそくなってきました。冬に買ったズボンがゆるい! というわけで、そば屋の帰りにユニクロに行ってちょっと買い物しました。買ったのは、迷彩カーゴパンツの半ズボンのやつ(Mサイズ 82cm) 1990円、ノータックのチノパン(85cm) 2990円、普通の綿100%のポロシャツ2枚(紺とピンク) 2990円、ヘンリーネックのTシャツ(M)白3枚 1290円。合計で1万円弱。ちょっと買いすぎたかな、とおもったけど、普通のシャツの1枚分の値段でしたネ。

ユニクロのポロシャツは、夏になるとたくさん種類でますね。でも普通の鹿の子で、無地で、綿100%のは1種類しかなかった。もう季節が遅いので、色によってはサイズが売り切れていて、たとえば白はXLしかありませんでした。結局、紺とピンクのポロシャツにしたんですが、Lサイズだとちょっとだぼだぼかなあ、Mサイズまで攻められるか? とおもったけど、肩幅がLでもピチピチだったのであきらめた ^^; 腹回りは余裕があるんですけどね、ええ!!

uniqlo

紺のポロシャツ+迷彩カーゴパンツ

半ズボンのカーゴパンツも今年は流行ってるらしい。まえからよく見るような気がするけど...そういえばアメリカ人はよくはいてるけど、日本人はあんまりはいてないような気もする。んー? わたしはジムで半ズボンはいてうんどうしているので、スネゲみせるのには抵抗ありません。半ズボンのカーゴパンツには紺のポロシャツみたいなわりときっちりしたのが合いますね。くだけたパンツ+くだけたシャツだとおもしろくないので。

ヘンリーネックのシャツは、半袖のシャツ(えり付きのやつね)のしたに着るといいのだ。しかもこの時期しか入手できない! 去年まで着てた、おととしかそのまえにかったやつはもうビヨビヨになって困ってたのだ ^^;;

チノはvoidさんが「またユニクロのチノパンのかたちがましになってきた」というのでちょっとみてみたら、確かにちょっとシルエットがよくなってる気がしたので、1本かっといた! これで夏の間、講義するときのズボンに困らなくてすみそうな? チノにはピンクのポロシャツがいいですね。ピンクを着ていると小学生から高校生にまで「ピンク好きなんですか?」とかきかれてモテモテになります。まちがいない。

いやーかいものはたのしいねー


Tuesday, July 03, 2007

英語版livedoor reader = fastladder発表

英語でつかえるlivedoor readerが発表されたようです。その名も「Fastladder」。livedoor readerってのは、RSSリーダーですね。fastladderはその英語版です。livedoor readerをつかうためにはlivedoor IDが必要ですが、fastladderはlivedoor IDは必要ありません。fastladderに登録すれば使えます。

fastladderは、今日発表になったばかりの、まだgoogleにもキャッシュされていないピカピカのほやほやです。「海外版」と紹介しているブログやら記事やらもちらほらみえますが、べつに「海外版」ってわけじゃないのですよね。英語なだけで。むしろlivedoor readerが国内版で、fastladderが「ふつう版」かな。

そのfastladder、さっそく登録してちょっとつかってみたけど、いつもつかっているbloglinesよりはやい感じ。イイネ。bloglinesからフィードリストをexportしてfastladderにimport可能です。fastladderの中の人によると、機能もbloglinesより高機能らしい。ピンつけて、あとから読み返したりとかね。しばらく使ってみます。


マッシュアップ用の無料ホスティングサービス

マッシュアップと言っても、レゲエではありません。「マッシュアップとは、複数の異なる提供元の技術やコンテンツを複合させて新しいサービスを形作ることである。複数のAPIを組み合わせて形成された、あたかもひとつのWebサービスであるかのような機能が、マッシュアップと呼ばれている」(引用:IT用語辞典バイナリより)。つまり、まえから書いているあわせて検索みたいなやつのことですね。

こういうサービスを動かすにはPHPやPerlなどの言語やデータベースを動かせる環境がないといけないのですが、いままで、無料のホスティングサービスではできるところがありませんでした。たぶん。そこで、今回MashupediaがMashup用の無料のホスティングサービスをはじめたそうです。とりあえず先着200名まで! この話はvoidさんに教えてもらいました。わたしも登録しておこうかなー


Monday, July 02, 2007

5インチfdドライブの接続

今日は、学校である先生から相談を受けました。「5インチのフロッピーに入っている文書を読み出したい」とのこと。さすがに学校にはもうすでに5インチのドライブはありません。ひとつもない。昔はいっぱいあったんだろうけどねえ ^^;

まあ5インチのドライブを買うのがいいんだろうね。でも元はなに用?ときいてみると、家にあるパソコンはPC-9801RX(!なつかしー)で、まだ稼動しているらしい。稼動はしているんだけど、外付けの3.5インチドライブが壊れたので「いまの」マシンに移せなくなったとのこと。なるほどね。

そしたら3.5インチのフロッピードライブを買うのがいいかなあ。それともCバスのイーサーカードか。うちにまだあった気がするが、どうだろう?


Sunday, July 01, 2007

faviconを表示してみた

以前書いたあわせて検索ですが、faviconを表示するようにしてみました。方法はfavicon.icoというファイルを作って、サイトにおくだけ。favicon.icoはもとの画像をつくって、たとえばfavicon.co.ukというようなサイトに読み込ませれば作れるみたいです。あとはfaviconを表示したいページの<head>〜</head>の中に、

<link rel="icon" href="http://saas-sfa.com/favicon.ico" type="image/x-icon" />
<link rel="shortcut icon" href="http://saas-sfa.com/favicon.ico" type="image/x-icon" />

と書くだけです。簡単ですねー。