2009/02/03

Groundhog Day

Groundhog Day
〔米〕 2月2日 ((Candlemas(聖燭節)の日;春の到来のめやすとする)).
日本では節分は立春の前日なんだけど、アメリカでは節分の前日に春が来るんだね。

... 違うか。

Googleの急上昇ワード (USA)で、"Punxsutawney Phil"とか上位を占めていたので調べてみた。

Wikipedia (English) Punxsutawney Phil
Wikipedia (English) Groundhog Day
Groundhog .org - the Official Site of the Punxsutawney Groundhog Club

groundhog (マーモット) が出てきて、尻尾の影が出来たら (曇っていたら)、もうすぐ春。そうでなければ冬はあと6週間続く。Punxsutawneyという街のPhil君が最も有名なマーモットらしく、全米から200万人の人が集まってくるらしい (人数はウソ)。ほかにも何匹かいるようで、WikipediaのGroundhog Dayの方には、今年も含めて毎年の結果が載ってるw。そんなことしてないで太巻きにかぶりつけw

"did the groundhog see his shadow"とか"groundhog day 2009"も上位に来ていたよ。

追記: 地球温暖化センターでも話題にしてた。 → "Punxy Phil the Skeptic

2009/02/02

お金は余っていても使わない

明日が不安だから。

Garbagenews.com 2009年01月31日 年齢階層別の金融資産保有割合をグラフ化してみる
高齢者が資産をためこんでおり、その傾向は強まっていることが分る。もちろん人口構成比の違いはあるだろうけど。

ここには、解決策は「今回の記事の主旨からは外れるので省略」としながらも
なぜ高齢者が金融資産をしまいこんだままなのか、この点の解決方法を探ることが、不況を打開する大きなカギとなるのかもしれない(ライフプランの概念の欠如、社会保障制度の不備、高齢者向けの魅力ある商品を企画する企業が少ないこと、などなど、考えれば理由はいくらでも浮かんできそうではあるが……)。
と書いている。

3つあげられているが、「社会保障制度の不備」は大きいと思う。社会保険庁はこれからもいろいろ問題でそうだし、医療も崩壊の危機に瀕しているので、これからは十分金を持っていないと病院に入れないかもしれない。死ぬまでに使い切るつもりで使って、もし予定していた以上に長生きしたらどうするの?

長生きするのも心配しなきゃいけないなんてあまり幸せな老後とは言えないけど、そう考えてしまうのも分る。

2009/02/01

Office Liveのアンケートより

こんにちは。

昔Hotmailを使っていて、それが今Windows Liveというサービスのひとつになっている。そのWindows Liveのサービスの「その他」のプルダウンメニューの中に、Office Liveというサービスがある。オンラインでOffice文書 (WordとかExcelとか) を編集、共有できる、Google Docsみたいなものと認識していた。

そこを開けてみたら、最初にアンケートが出てきた。無料で使わせてもらっているので、こういうのは積極的に協力しましょう。

その中で、「次の企業のサービス、製品をご利用ですか」というような設問があって、以下のものがあげられていた。

Box.net
Jive Clearspace
Linked In
Lotus Bluehouse
Google Apps/Docs/Sites (Google)
Adobe Acrobat.com
Facebook
Basecamp
Zoho
Huddle

類似のサービスがあげられているのだろうけど、こんなにあるんだね。使っているのはGoogleだけだった。FacebookはSNSだと思ってたけど... 似たようなサービスもあるのだろうか。

まずWindows Liveそのものだけど、2005年からあるんだね。

ITpro 2005/11/10 「Windows Live」と「Office Live」でGoogleとYahoo!を追撃

ただ、
「Office Live Basics」は,ドメイン名と30Mバイトのオンライン・ストレージ付きのWebサイト,5つまでのWebメール・アカウントを含む,オンライン参入開始キットのようなものを小規模な企業に提供するサービスになる。Office Live Basicsは無料になる予定だが,広告で運営される。
とあり、「オンラインでOffice文書を編集・共有する」というものではない。この記事にも
これらのサービスで何を作ろうとしているのかを知るのは難しい。これらのサービスには驚くべきものやオリジナルなものはほとんどなく,同社の主力製品に少し依存し過ぎているようだ。
なんて書いてある。表題では「GoogleとYahoo!を追撃」と勇ましいが、本文では、「いろいろな意味で,GoogleやYahoo!その他のオンライン上の組織がもたらす脅威へのMicrosoftの対応はちょっと気合に欠けている」なんて書かれている。

2008年になると評価が変わってくる。

@IT 2008/03/06 無償グループウェア付き、MS渾身の「Office Live」を使ってみた

ストレージ、ホームページ、メールアカウント、アクセス解析、グループウェア。そのグループウェアもスケジュール管理、掲示板、Wikiなどのほかに顧客管理ツールもある。無料なのに機能満載。

Google Appsでも同様のことができるが、"Small Business" 向けとしてのまとめ方はGoogleよりもとっつきやすそうにみえる。

ところで「オンラインでOffice文書を編集・共有する」はどうなったかというと、"Office Live" には上記記事で紹介されている "Office Live Small Business" と"Office Live Workspace" があり、後者のほうのようだ。

私は最初に登録した際に、個人向けか中小企業向けの違い (ユーザ数の違い) かと思っていたが、提供する機能が根本から違うものなんだ。登録時に個人向けのほうを選んだのは、Office文書の編集・共有という目的には合っていた訳だ。

とは言え...

MacのSafariは使えない。
Firefoxは使えるが、オンラインでの編集はできないようだ。
Windowsでもオンラインでの編集ではなく、下記をみるとデスクトップアプリとWebが連携しているだけのようだ (MS Office 2003とか2007を持っている必要がある)。

Microsoft Office Live Workspace Help Microsoft Office Live Workspace と Microsoft Office プログラムとの統合を強化する

Mac用Microsoft Office 2008のユーザなんだけどな。Mac用の連携もお願いしたいところだ。

以前作ったMapReduceの図をMicrosoft Office Live Workspaceで共有にしてみました。→ MapReduce

見ようとするとずっとプレビュー状態なのですが、私だけ?

2009/01/31

Bento 2: Excelからインポート

こんにちは。OpenDocって覚えてる?

Bento 2レポート3回目。今日はExcelファイルからのインポートについて。

前回書いたように、簡単なデータ集合だったら、表計算ソフトを使って管理するので十分だ。既にそうやって作られたデータ集合があれば活用したい。Bento 2には表計算ソフトからインポートする機能が備わっている。表計算からCSVファイルにエクスポートしてからインポートするのではなく、直接アプリケーションファイルからインポートできるのはありがたい。対応するアプリケーションには、デファクトスタンダードになっているExcelのほか、iWorkの表計算Numbersも入っている。

表形式で管理している場合、第一行に項目名を書いていることが多いと思われる。読み込み時にこれをデータベースのフィールド名とみなすことができる。その場合、第一行目はデータとしては読み込まれない。

実際に読み込みを始める前にその項目が列挙されるので、それぞれのフィールドのタイプを指定することができる。テキスト型、数値型、日付型/時間型以外に、通貨、レート、経過時間などがある。また、アドレスブック用のフィールドである、アドレスやメールアドレス、URLやIMアカウントも選べる。アドレスやIMアカウントは勤務先、自宅、その他の3種類が選べる。

それから「作成しない」というのも選べて、この場合は第一行に項目名はあるけれどもデータベースにする時にフィールドにしないということができる。

実際にやってみたところ、以下のようなことがわかった。

・ 一覧表形式になるだけでなく、レコードごとの表示 (「フォーム」も作られる。
・ URL型を指定したフィールド以外に「URLリスト」というフィールドが作られる。これは表形式では2つ出て来る訳ではないが、フォームでは2つのフィールドが表示され、同じ値が入っている。
・ Excelで時間を”hh:mm:ss”の形式で入れていたものを経過時間型にマップしたが、変換されていない。Excelは実際は時間でなく時刻なので、形式的にあわないのかもしれない。また、経過時間は”hh:mm:ss”の形式ではなく、「2週3日11時間23分」という形式かw, d, hなどの省略形式しか選べないので、使い勝手はあまりよくない。

2009/01/25

The Digital Vatican

教皇庁がYouTubeにチャネルを開きました。

イタリア語 http://jp.youtube.com/vaticanit
英語 http://jp.youtube.com/vatican

「光臨」って言葉は、こういうときのためにとっておかなくちゃいけなかったですね。

YouTube - Benedict XVI: internet a new way to speak of God
So that the Church and its message continue to be present in the great aeropagus of social communications as defined by John Paul II and so that it is not a stranger to those spaces where numerous young people search for answers and meaning in their lives, you must find new ways to spread voices and images of hope through the ever-evolving communications system that surrounds our planet
インターネットを用いないと人々に声を届けられないし、インターネットは多くの若者が人生の意味と答を探している場所だから、ということなんでしょうね。

データベースに期待すること

こんにちは。茜さんです (ウソ)。

今回は、前回の予告どおり、データベースに期待することをまとめてみたい。

表計算ソフトでもデータ整理はできる。最初の行のそれぞれの列には項目名を書いて、その後の行には項目名に対応した列に値を入れて行く。ソートができるし、オートフィルタで絞り込みができる。検索はシート全体からでも選択範囲からでもできる。フィルタを組み合わせると複数項目の組み合わせ検索もできる。計算で値をいれることもできる。レコード間の集計もできる。簡単なデータだったら表計算ソフトで十分だ。なによりスキーマをちゃんと設計しなくても始められるのが、ハードルが低くて良い。

ただMac版のExcelは重いようだ。特にソートは全部メモリに読み込んでいるようで、ソートのオプションがでるまでにかなり時間がかかる。Google Docsのスプレッドシートのほうが、ソートキーが一つだけという限定は出て来るものの高速だ。

Google Docsはネットにつながっていれば複数のコンピュータで使えるという利点をもつ。いちいち移動させなくて良いし、なによりも複数のコンピュータにアプリケーションをインストールする必要がない。Excelよりも機能は低いのだが、簡単にデータ整理を行うというには十分だ。

今回データベースを使おうというのだから、これら表計算ソフトに比べたメリットが必要だと思う。

・ 検索が充実していること: 表計算のフィルタは複数項目の組み合わせができると言っても全一致になる。表計算の検索は部分一致ができるが複数項目の組み合わせができない。組み合わせ (ブール演算) と部分一致ができるのが理想。

・ スキーマの設計が容易なこと: 後からフィールドを追加するのが簡単にできると良い。

・ 入力が容易: レコード入力画面を出して、1件1件入力して行くのではなく、コピー&ペーストができるのが望ましい。(Bento 2では表計算のように複数セルまとめて入力ができるようだ)

・ 画面設計が容易 (表計算との比較ではない): 特に画面ごとに用紙サイズまで変えないといけないのでは不便で、画面は常に大きく使えて印刷時だけ画面と連動した大きさになって欲しい。

・ テーブル間の関連: (これはデータベースにしかできないことだが) あるテーブルのひとつのレコードに、他のテーブルの複数のレコードが対応づけられる。JOIN操作まではできなくても良い。

・ ネットワークで複数のコンピュータから使える。専用のクライアントは不要でWebブラウザでアクセスできるのだとなお良い。

・ APIがあってアプリが組める。Ruby on RailsやGoogle App EngineのようにSQL文を使う必要がないのが望ましい。

最後のほうはBento 2ではできないと分っているし、低価格データベースなので出来ないことも容認できるのだが、ネットワークアクセスはGoogle Docsとの比較で考えればあって欲しいフィーチャーだ。

次回は表計算からのインポートを題材にする。

2009/01/24

台湾版定額給付金

こんにちは。ビビアン・スーです (ウソ)。

定額給付金に関しては、規模が小さいだけでなく、銀行振込にすることも効果が期待できないと考えている。

そんななかで、台湾でも同じようなばらまき政策を行うが、商品券方式を採用していることを知った。
AFPBB News 2009年01月18日 台湾、「消費券」を全住民に配布

この記事ではこれだけしか分らないが、少なくとも地域振興券とは違って各自治体に印刷、配布、回収のコストを負担させるものではなさそうだ。

さらに、ぶんさんの台湾式定額給付金によれば、「それを使って買い物をすると、その店でその倍額位の割引券がもらえたり、航空券なども、その券を使うとすごく安くなる」そうだ。これは政府だけでなく民間も一緒になって景気の浮揚に務めるということで、日本の方式よりも効果が期待できると思う。

銀行振込方式って、最初から政府が貯金してくれるようなもんだよな。

それだけでなく、お年寄りをターゲットにした詐欺がいろいろ出てきそうで心配だ。
定額給付金のために必要だと言って新しい口座を作らせたり、
その口座に年金の振込先を変更させたり、
手続きのためと言って今ある口座の通帳と印鑑を預かったり、
...
えーと、犯罪のヒントを与えている訳ではないので、良い子はそういうことをやらないように。犯罪がおこらないようにするための警告です。そういう犯罪が起きることのないようにしっかり対策してもらいたい。

それ以前に、だいたい誰がどの口座をもっているか紐付けするのはどうするんだろう。その作業を行う際にミスが出てきそうで、そこにも懸念があるな。

宇宙から見たオバマ米大統領の就任式

こんにちは。

こんな写真があったので、リンクしておきます。

AFP BB News 2009年01月22日 宇宙から見たオバマ米大統領の就任式、米社が衛星写真公開

これ式の前でしょうか。まだ隙間がありますね。

Google Map でおなじところを示したところ。ここでは横長になっていますが。
Washington Monument - The National Mall - Capitol

ワシントンモニュメントから国会議事堂まで2kmくらいあるんですよね。見えるのかな。

ニュース映像のピックアップもリンクしておきます。
CBS News Inauguration Sights And Sounds

2009/01/23

あらためて演説の深さを感じる

こんばんは。オバマの長女マリアは"Maria"じゃなくて"Malia"なんだね。今までみんな発音が間違っているんじゃないかと... ごめんなさいごめんなさい、発音の区別なんかできません。

就任演説は最初はインパクトの強いフレーズはなく、盛り上がりに欠けると感じました。生中継の同時通訳で聴いていたせいもあると思います。

しかし、その後皆さんが書かれているように (最後に列挙します)、再度読むと、言葉を選んで良く考えられていると思います。

現実を直視する一方、アメリカが困難に立ち向かい成し遂げてきたことを踏まえ、今も国民は同じように立ち向かうポテンシャルを持っていることを訴えている。アメリカは強大な国であるという自負をもちつつも、他国と協調して生きて行くというメッセージを世界に伝えている。敵対する国に対しても断固とした姿勢を示しながらも、「その握りこぶしをほどくならば、我々も手を差し伸べる」と伝える。

国民には過剰な期待があったと思うが、それに対して、再建には国民の努力が必要なのだということを繰り返し訴えている。前の記事のコメントでも、また勝利演説の時にも書いたことだが、ケネディの「あなたの国家があなたのために何をしてくれるかではなく、あなたがあなたの国家のために何ができるかを問おう」という言葉を思い出す。

今日はPodcastで20日のABC, CBS, NBCのニュースを見ていました。もちろん編集もあるのだろうけど、民衆はオバマのこのメッセージを受入れた上で希望を感じているように思う。すなわち国民には困難に立ち向かう覚悟があるということだ。この大統領にだったらついて行こうという意志に思える。

ただしそれを維持するのは困難を伴うと思う。国民が等しく困難に立ち向かっていると感じられる状況を維持して行かなければならない。そうでなければ人心ははなれていくだろう。

ちょうど「痛みを伴う改革」を喜んで受入れたはずなのに、結果を見ると「痛み」に耐えたは国民だけであって、官僚組織は相変わらず甘い汁を吸い続けていることがあきらかになった今、自民党の支持が急落している日本のように。

現実を直視しつつ高い理想を語るオバマ。流されずしっかりと進んで行ってもらいたい。そしてアメリカ国民も、その理想主義と勤勉さ (これはだいぶ忘れ去られていると思うが基本は真面目な国民なんだと思う) で、しっかりとついていってもらいたいと思う。

毎日新聞 2009年1月21日
オバマ大統領就任演説:全文(1)恐れでなく希望を選んだ (魚拓)
オバマ大統領就任演説:全文(2)立ち上がり、再建しよう (魚拓)
オバマ大統領就任演説:全文(3)イラク撤退、温暖化防ぐ (魚拓)
オバマ大統領就任演説:全文(4止)新時代への責任を (魚拓)

毎日新聞 2009年1月20日
写真特集 - オバマ新大統領:宣誓し就任 演説で「米国の再生」誓う
写真特集 - 歴代のアメリカ大統領を振り返る

追記: 「英語で聴く オバマ大統領就任演説」という番組が、NHKで、 2009年 1月24日(土)翌日午前0:55〜翌日午前1:20 にありますよ!(→ 番組HP)

■ オバマの就任演説を改めて評価している皆さん

ぶんさん: オバマの言葉の読み方
  -- オバマの、現実主義の上に理想を求める姿に期待している。
はりーさん: 選ばれし
  -- 演説そのものよりもオバマの覚悟、威厳を評価している。
らふぃさん: 国民統合のための儀式としての就任式
  -- オバマの演説に匹敵する、アメリカの現実・矛盾を直視しつつも理想を語る名文。

2009/01/21

いよいよですね

こんばんは。ノッチです (ウソ)。

もう公式グッズ買った?メダルセット 3000ドルなんていかがですか?

先日「盛り上がってきました」と書きましたが、ついにこの日、間もなく就任式です。ワシントンは氷点下だけど人々の熱気がそれを感じさせない、ってどこのニュースでもいっていますね。

日本での放送はNHKであります。それ以外でもあるようですが。
オバマ大統領就任式 2009年 1月20日(火)翌日午前1:10〜翌日午前2:35(85分)

本家ストリーミング: http://pic2009.org/live

なんといっても演説に期待ですね。ミシェル夫人が「今度のはもっといいわよ」って御用列車の中で報道陣に言うと、オバマが "シーッ"って制止していましたね。

あれは何の演説なんだろう、キング牧師があの名演説をした場所で、キング牧師の夢に言及し、背後のリンカーン像にも触れていました。きっと就任演説も、アメリカの歴史とアメリカンドリームを語るものになるでしょうね。

インタビューで「泊まるところはないけれど私はこの場所にいたいの」と語っていた黒人女性が印象的でした。そう、歴史の証言者として、多くの人と感動を分かち合いたいんですよね。

どうしようかな。起きていようかな。

最後に期待を語っている皆さんの記事のリンクを載せておきましょう。

ぶんさん: 歴史的明日
らふぃさん: ワシントン最高気温摂氏0度

2009/01/18

Bento 2 体験モニターに当選した

こんにちは。山田太郎です (ウソ)。ってにも使ってましたよ。

先日、Mac Fanで募集していたBento 2 体験モニターに当選したというメールが来ていました。

Bentoに関しては、バージョン1で無料評価版をダウンロードして使ってみたのですが、無料評価版だと、
・もし買わないことにした場合に入力したデータが無駄になるので、本腰を入れて使う気になれない。
一方で
・本格的に使わないと良さが分らない。
というジレンマがあって、結局本格的に使わず、試用期間が終わってしまっていたのでした。

モニターになると期間終了後も使えるので、このジレンマが解消されて本格的に使えそうです。

結局その後いろいろな情報の整理は、以下のようなものを使っています。
・ AppleWorksのデータベース: ClarisWorksの時に住所録を作ってそのまま使っている。葉書の宛名印刷のときにフォームを切り替えてさらに「用紙設定」で葉書サイズに変更しなければいけないのが不便で時々間違える。
・ ExcelまたはGoogleスプレッドシート: 項目が揃っていて表形式で整理できるものには向いている。また同じフィールド値をもつものはコピーしやすい。長いテキストは入れにくい (入れられはするが、見にくくなる)。
・ Google SitesやEvernote:自由形式でテキストを入れるもの。添付ファイルがあるもの。レコード間の関係づけをしたいもの (パーマリンク、タグなど)。
・ メディアマーカー: 書籍やDVDなど専用に特化されている。
当然ながらどれも一長一短があって、満足できるものになっていないのですよね。この点でBentoがどのように使えるのか考えて行きたいと思います。次回はデータベースに期待することをまとめてみたいと思います。

追記: 書きました。→ データベースに期待すること

ところでモニターの義務ですが、
・ 最低5回のレポートを制作、公開。1記事あたり最低500文字以上とします。
・ テンプレートを2点制作、公開。
通常最後にレポート書けばよいというのが多いので、結構義務が大きいように思います。
「サンゴ礁の島の管理人」に応募した方がよかったかもしれません。

これは1回目のレポートにするつもりですが、Bentoの内容には触れていないのでカウントされないかもしれません。

それからレポートとして参照されるので、コメントも一緒に読まれると思います。コメントを下さる方はその点お含みおき下さい。

2009/01/17

ウソから出た偽

おはようございます。厚木駅を「ウソ厚木」と呼んでいたのですが、一般には「偽厚木」と呼ばれているみたいですね (神奈川ローカルの話ですみません → 参照)。

はりーさんがやっていたので、私も偽印良品を試してみました。

にぶろぐ 1個
国産の責任と全貌をつかい、たっぷり全貌な味に仕あげました。春夏おすすめのキャラクターです。最新号もいっしょにお楽しみください。
税込
378

(本体価格
360円)


「全貌」が2回使われていてちょっと残念だ。

これではどうかな。→ http://sites.google.com/site/exbloggers/

Home: エキブロ - ブロガー情報共有サイト ?(exbloggers?) 1個
笑をベースに、用語とエキブロブロガーの知識を生かして記事に仕あげました。茹であげた基礎に絡めるだけの簡単コミュニティー中年です。
税込
1187

(本体価格
1130円)


「中年」ってどこからとってきたんだろ?

おまけ: 日本語が全然入ってないサイトだとこうなるよ。

Yahoo Analysis Test 1個
味つけをしていないです。のを振りかけて、なが楽しめます。新感覚のをお試しください。
税込
536

(本体価格
510円)


テンプレートとしては、
味つけをしていない X です。X の X を振りかけて、X な X が楽しめます。新感覚の X をお試しください。
かな。

盛り上がってきました

http://twitter.com/obamainaugural
Presidential Inauguration Committee

"Inauguration"という言葉を今回初めて知りました。

上記サイトでは、公式グッズも売ってるんですね。これまでもあったのかな。

そうそう、COURRiER JAPONの最新号に、オバマ勝利演説のDVDが付録についてきて、本誌には解説記事『オバマに学ぶ「カリスマ・スピーチ術」』が載ってますよ。

2009/01/14

自己責任意識の強い国民にお金をばらまいても ...

... 消費は増えない、内需は拡大しない。

だって何かあったとき政府は助けてくれないし、ほかの国民からは甘えるなと叩かれる。

お金が余分にあるから使っちゃえというのは江戸っ子としては褒められても、現代の日本人としては感心できないよな。

年金がしっかりしていれば使いきっても安心だけど、どうなるか分らないもんな。これまでどれだけ消えたかまだ全貌が分ってないし、民間から迎え入れた長官だって、保険料を適切に集めるより、保険料の免除を増やして見かけの納付率を上げることを目標にした。401kだって自己責任だし。

医療費とか生活費だってこれからどれだけかかるようになるか分らない。

定額給付金がその足しになるとは思わないけど、少しでもお金は大事にしないとね。

使ってもらおうと思ったら、もっと金額をうんと増やして、一回きりでなくて定期的に配るようにする必要があると思う。ずっと入ることが分っていたら貯めててもしょうがないしな。

定額給付金:「さもしい」首相撤回「高額所得者も盛大に」 (毎日新聞 2009年1月13日)

「盛大に」って何だよ。そういうことは盛大に配ってから言えって。

こういうことを考えると、社会保障こそ最大の景気対策だと思う。というわけでこの話はベーシックインカムに続く。

2009/01/13

Yahoo!日本語係り受け解析を使ってみた

こんばんは。私インターネットのヤホーというサイトで調べていたら、グーグルといういろいろなサービスを提供しているサイトを見つけてしまいました。

今日は休みだったので、こんなのを作ってみました (解析部分は昨年末からできていたのですがずっとほっておいていました)。

Google App Engineから、
Yahoo!の日本語係り受け解析を呼び出し、その係り受け関係を
Google Visualization APIのひとつ組織図の形式で表示します。

入り口はここ: Yahoo Analysis Test [追記:サービス停止しました]

日本語の文を下記にテキストエリアに入れて、"Analyze"ボタンを押します。


下記のようなツリー形式で表示されます。


係り側は出現順に左から右に配置できれば良かったのですが、まだ詳しい使い方を理解していないので、ご勘弁を。

表示に関しては、Ortho というライブラリがもっと良さそうなのですが、ちょっとGoogleのよりもハードルが高そうなのでこれはあとの課題にしたいと思います。

それからほとんどテストしていませんので、へんなメッセージが一面に出たら何を入れてそうなったか教えて下さい。

参考:
CodeZine (2008/08/21) Yahoo!、「日本語係り受け解析Webサービス」のAPIを公開
たつをの ChangeLog (2008/08/21) ヤフーの日本語係り受け解析APIとサンプルプログラム「なんちゃって文章要約」

2009/01/08

Places目当てにReplace?

ジオタグ対応かあ。今までiPhotoは使っていなかったが、俄然使いたくなるな。もちろんジオタグ対応のカメラも、というよりiPhoneもということなんだけど。

2009/01/06

派遣村を見ていると ...

... ベルリンの壁崩壊の前ってこんな感じだったのかなと思う。

Wikipedia 汎ヨーロッパ・ピクニック

もう少し人数は必要かもしれない。

それから、2chの反応と、それに対するはてなブックマークのコメントの一部を見ていると、まだ共感が十分得られていないように思う (はてな村の住民は以前は2ちゃんねらとは一線を画していたのだが、最近はかなり同化しているのが悲しい)。
はてなブックマーク > 痛いニュース(ノ∀`):「厚労省は5日以降の衣食住も提供せよ」…『派遣村』から6項目の要望

増山麗奈さんが、
自分たちだけが幸せならいい、負けた奴は自分のせいという自己責任論が、繋がりをぶちぶちと切って来た。
と指摘しているとおりだと思う。さらにいえば、負け組を叩くことで自分が勝ち組にいると思う、そういう思考回路を与えられてきたのだと思う。

湯浅さんには頑張ってもらいたい。

まず、日本国憲法
第25条 すべて国民は、健康で文化的な最低限度の生活を営む権利を有する。
をストレートに押し出すのも必要だが、働く意思があるが仕事がないということも強く打ち出さないと、こんな人も出てくる。

派遣村:「本当に働こうとしている人か」と坂本総務政務官 (毎日新聞 2009年1月5日)

追記: 第25条で「すべて国民は」と言っているのはわかっているのだが、今国民に受入れる素地があるとは言い難いと思う。そのため最後に「働く意思のあることを打ち出せ」と書いた。

この件は、技術が上がれば労働需要が減る
そろそろ「無職」という職を社会的にきちんと認めなければならないところまで、生産性は上がっちゃったような気がするんだけど、
にもつながると思う。

2009/01/02

MapReduceってこういうことか

こんにちは。PigeonRank 作成作業員です (ウソ)。

Googleでは、並列計算の枠組みMapReduceを使って、ページのインデックスを作ったり、ページランクを計算している。

ページのインデックスを作るというのは、
・Webページ群の各ページにある単語 (実際はNgram) の並びを抜き出して、
・単語から、その単語をもつページ群を割り出す (これを保持する)
ということ。

また、ページランクを計算する時には逆リンクを求める必要がある。あるページからリンクがはってあるページ群の逆で、あるページへのリンクをもつページの集合。これはWeb全体を見なければ分らない。これを被参照ページごとに行うのではなく、まとめて行う。
・Webページ群の各ページにあるリンク先を抜き出して、
・リンク先ページから、そのページへのリンクをもつページを全て抜きだす。

これらの共通点は、行列の計算をそれぞれの軸で行っているということ。すなわち、
インデックス: ページ軸 → 単語ベクトル、単語軸 → ページベクトル
逆リンク: リンクページ軸 → 被リンクページベクトル、被リンクページ → リンクページベクトル
[補足] 実際はベクトルではなくハッシュ表なのだが、ここではベクトルで説明する。

この最初のステップをMapで、次のステップをReduceで並列計算する。その間にMapの計算結果 (ベクトルのベクトル = 行列) をスライスしてReduce用の計算機に分配するShuffleのフェーズが入る。

図解にするとこんな感じ。
アニメーションをつけたPowerPointプレゼンテーションを置きました。



次に、インデックス抽出の事例をここにあてはめてみる。

ここでは単純化のため、形態素解析で分割された文字列を単語として扱うが、Googleでは任意の文字列で検索できるのでNgramを用いていると考えられる。もちろん英単語をカタカナで検索できたりするということは単語がわかっているということなので、形態素解析も併用していると考えられる。また「バイオリン」でも「ヴァイオリン」でも検索できるので表記違いもあわせてインデックス化しているかもしれない (検索時に展開する方法もあるのでGoogleが実際にどちらを採用しているかは分らない)。

1) Map: Webページ群をプロセッサの数に応じて割り当てる。WebページURLとそのコンテンツ (テキスト) を入力として、単語の並びを抽出する。ここでは存在することを●で示しているが、個数を記録しておけば、その単語を多く含むページを優先させる処理が可能になる。

2) Shuffle: Mapの結果をベクトルの要素ごとに決めたプロセッサに分配する。ここではベクトルと書いたが、ある単語を処理するプロセッサが特定できれば良いので、実際はハッシュを用いている。

3) Reduce: 各単語ごとの処理を行う。ここではその単語を含むページ (URL) のリストを作成する。Mapの段階で単語の個数を記録していた場合は、URLと単語個数の対のリストを返す。あわせてURLの個数を計算することで、その単語がどれだけ多くの文書で使われる一般性の高い用語なのかの尺度DF (Document Frequency) を得ることができる。

アルゴリズムによってはMapとReduceの組み合わせではなく、Mapの結果は既に入力として持っていてReduce処理だけ必要というものもでてくるだろう。またアルゴリズムによっては1段のMapReuceでは足りず、複数回適用する必要があるものも出ると思われる。

以上、誤解等ご指摘いただければ幸いです。

参考文献
Radium Software Development: MapReduce
  -- 「フィルター」と「アグリゲーター」の2段階から構成されると考える
原論文 (すみません読んでません) MapReduce: Simplified Data Processing on Large Clusters

2009/01/01

お正月-お節料理

あらためておめでとうございます。

遅くに年越し蕎麦を食べたのでお腹がすかず、先に初売りで福袋を買ってきてから、お節料理をいただきました。

今年のお節料理は、うちの奥さん頑張ってくれて多種類揃いました。娘もいろいろ手伝ってくれて助かったそうです。


左から二の重、三の重、一の重。

二の重の右奥にミートローフ、三の重右手前に豚角煮があります。お節は物足りない感じがしがちなので毎年こういうのを加えて、一方で定番のものを外したりするのですが、今年は両方加えて定番のものをなにも外してないんじゃないかな。

一の重の右奥はきんとんの代わりのスイートポテトです。娘が作りました。柚子の香りが移ってさらにおいしくなりました。

このほかにお刺身をいただきました。

おいしゅうございました。日本酒もたくさん飲んだので、そのあと昼寝してました。本格的にベッドの中で2時間半。これからまた飲むよ。

一年の計は元旦にあり。ご馳走をいただいた後は、少し気を引き締めて勉強するかな。

あけましておめでとうございます '09

本年もよろしくおつきあいください。


思い通りにならない場合が続くかもしれません。しかし、明日のために、日々を有意義に使って行きたいと思います。

Tomorrow is another day
Lifehacking.jp 心を大事にして、今を乗り切ろう

追記: せばさんのところで知ったんですが、エキブロの時計が遅れてるんですね。マニュアル修正します。