現代魔法を操る世界


by kagurayouyou
カレンダー
S M T W T F S
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31

カテゴリ:日記( 220 )

mixiばかりに投稿していると、全然Blogが書けません。
自然言語関係の面白いネタも全然です。
今はEclipse関係が多いのでそっちのネタばかりですね。
久しぶりにアクセスを調べてみると、やはりSVMの検索率は高いですね。

しかし自然言語ではSVMがそろそろ少なくなってきているし、
そろそろこの辺で、まともに使えるようなソフトがないと世間的に厳しいですよね。
(検索系では十分ありますし、初音ミクの画像検索では多少形態素の話が表に出ましたが)

ネタとしては初音ミク+自然言語とかあるのですが、初音ミクが難しい。
私の自然言語としては、今上記のとおり多少まともに使用できるソフトがないと、
基礎研究ばかりしても大変なので、「伺か」のようにデスクトップツールとして、
一つ作ってみているところですが、出張が多すぎてやっと来週から腰が落ち着けられるところです。
#今週はまだ忙しいので。

ちなみに今は仕事と私用を両立できるツール巡りばかりしています。
実は会社と言うものはやっかいで、セキュリティが強くなるばかりで
利便性がどんどん落ちていきます。

今のところうまくいっているのはブラウザ関係で、私はSleipnior派なのです。
firefoxとかも良いのかも知れませんが、どうしてもあらゆる会社のシステムはIE標準です。
そのため、IEエンジンがないと駄目なのです。
ただ、私としてはお気に入りの機能が使用しづらく、
「お気に入りタグ検索」とか欲しいし、お気に入りエクスポートがもうちょっと互換性あれば
良いのになと思います。
[PR]
by kagurayouyou | 2007-11-11 20:57 | 日記

BLOGは便利か?

【戯言】
現在サイトの再構築中です。
Wikiを消しました。
運悪くWikiが検索に引っかかってしまってこられた方、ごめんなさい。
近々このブログも考え直そうかと思います。
結構使いづらかったりするんですよね。
カテゴリは複数つけれないとか。

Blogは思考を辿るのに良いToolだとは思いますが、
カテゴリをうまくしないと散在するし、
現在の私の書き方では散在かつ、検索にひっかかっても見つけるのが大変。

というわけで一度整理しようかと思います。

と言っても9月とかになりそうですけど(笑
[PR]
by kagurayouyou | 2007-07-07 18:24 | 日記

久しぶりの更新

久しぶりに日記。
昔書いたことがあるけれど、mixiをやってしまうと、
こっちの更新がなくなってしまう。
私は一般人なので二つを更新していくのが面倒くさくなる。
結構SVM関係で検索されているっぽいのですが、
申し訳ないのですが、たぶん求めている情報はないと思います。
私の試行錯誤の日記しかありません。

社会人となった今でも自然言語はやめられない。
なんとかまとめたいのにまとめる時間がおしい。

再度ちょっとまとめ。

C#でchasenを使用する場合、
茶筌forC#が便利。
http://members9.tsukaeru.net/daina_k/

SVMについて。
SVMは便利です。使い方は日本語の場合、
石田貴士さんのWEBページの
http://www.bi.a.u-tokyo.ac.jp/~tak/svm.html
がわかりやすい。

svmlightとlibsvmを自然言語で使用してみて、
思った感想は、あくまで直感ですけど、このまま純粋なSVMで精度は上がらない。
(純粋なSVMっていうのもまた変だけどね。)
と言うのも理論がわかりやすく、上手くできているために、
それ以上の成果を出そうと思うと、すごく細かく、ブラックボックスな中身を改良しなければ
ならないと思う。
なので主成分分析とか組み合わせ方式、Rankingとかそういうのが必要かかなと。
(もうすでにされてますけど)
[PR]
by kagurayouyou | 2007-05-22 22:28 | 日記

文章生成のための解析

【人工知能・無脳】
文章生成後の評価を考えているのですが、
どういうルールで行えばよいのかさっぱりです。

私は主に解析や機械学習などの方が専門に近いので生成はほぼ知らないと言っていい
状態で以下素人すぎる論理ですが、メモ程度に書きます。

現在は形態素解析、構文解析、意味解析の3つが主な解析だと思います。
必要なのは線形的な状態で評価できるというのが良くあると思います。
現在私が考えているのが、複雑な組み合わせである日本語にでも、
巨視的に見れば法則があるのではないか?という疑問です。
現在作っている暇は無いのが残念ですが、形態素、構文、意味、の3種も一つの
形態素に合わされば固有の法則が産まれないかということですね。
と言っても解析の精度が追いついていない状態で、絶対値の評価となるルールを
作ることはなかなか難しいですね。

研究の方ですが、なんか無事に終わりそうです。すごく適当ですが。

【コンピュータ】
本来二つの項目は書かないつもりですが、フォントの話なので今回は異例。
VistaのBusinessを入れました。
日本語にもアンチエイリアスがかかると聞いて楽しみにしていたのですが、
それほどきれいではなく、メイリオが悪いのか、それともヒラギノでないとだめなのか、
そこらへんはまだ触っている途中ですので分かりませんが、
このままならVistaはまだ本腰を入れて動かしづらいですね。
PenD 3.0GHz、PC4200 1GB、GeForce6600GT(256MB)で最低4.2の
スコアが出るので、3DゲームができるPCであれば十分動かせるでしょう。
[PR]
by kagurayouyou | 2006-12-09 21:54 | 日記

SVM比較をしなければ。

【人工知能・無脳】
TinySVM,libSVM,SVMlight。
これを詳しく比較したデータが見つかりません。
と言うより、SVMのソフトの検証を論文ではしていないものが多いのだが、
どこかで証明は取れているのだろうか?
私の場合、精度がソフトによって変わるのだけど。。。
誰か知っていらっしゃる方がいたら教えてください。

しかしTinySVMは結構秀逸。
なのに広まらないのは日本産のせいか、機能が少ないからか。。。

最近実験と調査もしくはプログラミングばかりしていて、人工知能が作れない。
大きなベクトルの向きは同じだが、研究はすごく地道で細かい。

SQLの方を今週末に少しやりたいと思います。
[PR]
by kagurayouyou | 2006-10-27 22:51 | 日記

ケータイ音楽

【コンピュータ】
NW-S705F(黒)を買いました。
・いつもPCを聞いているせいか、低重音に張りがあり、
高音に伸びがある。

・SONYは低重音に強いせいか、フラットの状態でも
低重音が効いている。

・付属のイヤホンはイヤホンの役目しか果たせないので残念。
ヘッドホンで聞くより音がきれいに聞こえない。
(当たり前だが)
着け心地とかは普通のイヤホン。

・ジャケット表示ができることを少し売りにしていたけど、
画面がそもそも小さいので認識しにくい。

・NW-S7xxFシリーズのみか分からないけどイコライザが
クイックでフラット、設定1、設定2と選べ、
ユーザの5バンドイコライザが二つ記憶できる。
プリセットには高音を重視したのがuniqueしかない。
私は高音が好きなので、このイコライザは貴重。
しかしイコライザによって結構音が変わるので、
曲一つ一つに設定できた方が嬉しい。

・電源は切れない。つまり停止状態で有機ELが消えて終わり。
それでもほとんど電力消費は無いらしい。

・SonicStageを使ってみて、、、まあなかなかですね。
iTunesのようにシンプルじゃないけど、そこまで悪くはありません。
[PR]
by kagurayouyou | 2006-10-22 22:24 | 日記

好きよ好きよも嫌のうち

【戯言】
現在実家に帰ってます。
なのに研究とか。やっぱり好きなんだなと実感。

【人工知能・無能】
・知識獲得済みデータにデータベースを使用するか否か。
つまり知識獲得時状態と同じままデータ保存をしておいたほうが良いのか、
そのほかの冗長なデータは切り離して、形成して
データベースを構築したほうが良いのか。

人間の脳とした場合、人間は検索機能が弱いと思うので、
データベースを構築したほうがいいのだろうが、
コンピュータはそんなことはない。
しかし理解能力がコンピュータは低いので、データベースを構築したほうが、
便利そうではある。
これは先日書いたQAシステムに要約が必要かどうかと同じ問題。

実際通常の全文検索とキーワード検索ではキーワード検索の方が圧倒的に
キーワード検索の方が早いだろう。
短期記憶としてでもいいからデータベースを構築したほうがいいと考えた。

・呼吸は無意識に行われる。
今作るのにてこずっている問題が、どのオブジェクトにどの動きを与えるかに悩んでいる。
プログラミング的にはめんどくさいし、煩雑になるが、
区分けしてスレッドでそれぞれを行う方法とか、
スレッドを使わずに単一で行えるところは単一で行うようにするかとかに悩んでいる。
(C#でスレッドプログラミングはデリゲートなどがめんどくさい)
そこで出てくる言葉が無意識。
無意識という言葉を使用する場合、そのオブジェクトで行えてしまうことを無意識と呼び、
別なオブジェクト(この場合脳の言語野とか)に渡すことを意識と呼べば結構すんなりいく、
脊髄反射な部分としてプログラムすればプログラム的には簡単だし、
そういう風に認識すれば、人間としても認識しやすいのだろう。

・新たなる問題は脊髄反射は必ず脊髄反射なのか?
たとえばひざの下の部分をたたくと勝手に足が動きますが、
それは一定量の力を加えたときなのか、それとも必ず触れたときに脊髄反射をするのか?
一応熱に触ったときの例を見ると、温くても脊髄反射はしないわけだから、
脊髄反射は一定量(=閾値がある)を加えると脳にいかずに反射させるのだろう。
[PR]
by kagurayouyou | 2006-08-10 13:45 | 日記

QAのメモ

【戯言】
質問応答システムにおけるメモ。
それぞれ、自分なりに考えた結果を出しただけで、
証明したわけではないので注意。

・質問応答システムは自然文でなければならないか?
これは否だと思う。質問応答システム自体は数種の単語によって
検索抽出できるのならば最もそれが早い。(言葉の短縮)

・では自然文で検索する理由は?
現段階で単語の場合、どれが疑問の単語なのか。
どの言葉に関連するものを調べればよいのかとかは分からないと思われる。
例「ドラえもん 誕生日」
ならば人間でこれが『疑問文である』と必ず分かるならば、
「ドラえもんの誕生日は?」
という文章に変換できる。
コンピュータも「誕生日=月日を聞く単語」という定義があれば、
検索できなくはないかもしれない。
単語だけでは抽出できない文とは構文の係り受けが重要な意味を持つ場合である。
その場合は何だろう?
今は思いつかない。
一応最も大きい問題は対話型や音声入力で自然文となってしまう場合くらいだろうか。

・WWW用の質問応答システムにおいて、要約は使用可能か?
検索するためにはGoogleなどでの検索ではキャッシュ、
Namazuはインデックスを作成する。
そのために膨大な量になるかもしれないが、要約の使用は可能である。

・では要約と本文をどのような割合で使用するか。
検索や計算の速度によるけれども、全て使った方が最もよいと思う。
ただし、余計な回答まで含まれてしまう可能性がある。
ここら辺は抽出と合わせて考えなければならない。
[PR]
by kagurayouyou | 2006-08-08 16:10 | 日記
【戯言】
技術系オタクほどヤヴァイ(!=危険思想)人物はいないね。
彼らはその技術、能力を趣味に全力で注ぎ込むし、
かつ出来上がったものはそのベクトルにおいて秀逸です。
すばらしきオタク人生。。。

オタクオタクとか呼ばれるけど、結構同属嫌悪って言うのがあるのが普通だよね。
こだわりがあればあるほど、真ん中以外はどうでもいい。
って言うか他人からはわからない。
実際~系オタクって言うのが一番しっくり来る見方ではないだろうか?
それなりに自分がオタクだと認知しているだろうし。

私の中ではやっぱりどうしても中途半端なオタクは好きになれない。
私の語彙にはないけど、もっとも一般的なオタク、
漫画を見たり、アニメを見たりするがかと言ってパロれるわけでもなく、
一般人とほぼ同じ行動で、むしろぎりぎり一般人って言う感じ。
そういう人に向かって何の話をすればいいかかなり迷う。
オタクの話をしてもわからないし、一般向けの話をしてもわからないし、
むしろお前の興味は何なんだ?と言いたい。

【人工知能・無脳】
マルチスレッドでのプログラミングが難しい。
と言うよりか、もうグローバルでもいいんじゃね?モードが強い。
C#でグローバル関数が使われないのはオブジェクト指向が
強いからなのかもしれませんが、
他のオブジェクトからスレッドを動かしたい時、グローバルにしないといけないほど、
遠くから操作するから、アルゴリズムを考えて如何にprivateにするかは難しい。
スレッドしたあとにForm_Loadで自動的に処理し始めようとすると、
オブジェクト(コンポーネント?)の表示が後になるのでスレッドで
処理をするとスレッドのスレッドとかになってしまう。

不思議なのはオプションの画面。
StudioもそうだしSleipnirとかもそうだけど、タブ式じゃなくて
左にツリー、右に画面で、その右画面が種類によって動的に違う場合、
どうやっているのだろう?
最初は動的にやっているのかと思ったが、
その場合他のを映し出す時に開放するのだろうから、OKボタンを押したら、
設定が反映されなくなる。
なので単純にオブジェクトのグループを重ね書きしてVisibleの
オンオフを繰り返すのだろうか?
でもその場合すごく作りにくい。というか見にくい。
何かクラスとかでうまい方法をしているのだろう。
タブ式でも構わないだろうし、そっちのが早いのですが、ちょっと挑戦します。

ここでネットワークの設定とかやるので早めに作り上げなくては。

あとは設定ファイルとかをXMLで書き出す.configとかちょっと調べないと。
[PR]
by kagurayouyou | 2006-08-01 01:20 | 日記
【戯言】
そーいえば、私の就職先の内々定者のサイトができたらしい。
なかなかすごげ(メンバーが)
日本でもトップクラスの大学名がちらほら(っていうかほぼ?)
しかもなんかみんな外で遊ぶのが好きというか、スポーツをやる人多し。
私は真逆。
そう考えてオタク街道に走ることにしました。
オタクのイメージを払拭しないオタク。
と言うか、これぞオタククリエーターと言うキャラで行きたい(願望)
まあ結局やっていることはオタクなんですけどね。
逆に言えば単にオタクをやっているわけじゃないね、この人とか言われる風味。
私の友達にいますが本当にオタクの奴はどうしようもない。
電車男とかいますし、ゲームでもありますけど、自分は実は隠し能力を持っている
とかありえない。
使えねー奴は使えねー。
これまた逆に言えばどんな性格悪くてもすごい奴っているじゃないですか。
そんな感じ。(好かれるとは限りませんが)
これは生まれもってなのか。努力なのか。わかりませんが、
そんな使えねー奴にならないようになりたいと思います。

でも私の場合オタクより理工系って言う感じがします(自己分析)
なんでレベルの高い大学の理工系はスポーツが好きな人が多いんでしょう(偏見?)
やっぱりスポーツ万能、頭脳明晰、容姿端麗、性格温厚。
は男女どちらからでも好かれるのでしょうか。
蓼食う虫も好き好きってやつで勘弁。

【人工知能・無脳】
やっと再開。というか規格をまとめていた。
やはり開発は楽しい。
有用かどうかを検討しての研究ではないく、思ったままに感じたままに開発する。
=理工系にあるまじき開発。普通潰れるしね。実際前のプログラムは潰れたし。
[PR]
by kagurayouyou | 2006-07-22 19:52 | 日記