社長のブログ

20 件のうち、 11 件目から 20 件目を表示します。 1 2

IPアドレスの枯渇

IPv4 のアドレス空間の枯渇が話題になってもう随分になる。一説では、2010年には枯渇するだろうということだったので、今年がそろそろその正念場ということなのだろう。
当社でも、去年いろいろあって、昔に確保していたクラスCのアドレス空間を返上することにした。

固定IPオプションで何千円もとるプロバイダが多い中で、一度返上してしまえば二度と確保することはできないだろうとは思ったが、結局ルーティング経路を確保できなければ宝の持ち腐れのわけで...

そんなわけで、そろそろ IPv6 への対応も視野にいれて活動しないといけないのだが、これも繋がってなんぼの世界なので、プロバイダが対応しないことにはどうしようもない。IPv6 over IPv4 で実験するか、社内ローカルの閉じた世界で実施するか... あまり直接的なメリットが浮かばない。

IPv4 と IPv6を同時に動かすといろいろトラブルが多かったので、OSのKernelレベルで IPv6を無効にしていることが多いのだが、そろそろトラブル回避のKnowHow作りのためにも IPv6をデフォールトで有効にした方がいいのかもしれない。

組み込みFreeBSD

embeddedな分野だと、linuxやnetbsdの方がずっと一般的で、数千円程度の市販機器にlinuxを入れてみました、なんて記事はたくさんあるのに、freeBSDとなるとほとんどない。( もちろん、picoBSDとかがあるのは知っているけれど、それが実際に使われている例と言うと... )

2.2.x の頃はまだKernelのサイズも 1MB強位で、gzipすれば7~800KBで納まってそれに、crunchgenしたbinaryを組み合わせて 1FD BSDという試みもかなりあったし、実際 XFree86を組み入れて 1FD X-server をぎりぎり1.4MBに納めてみたりしたこともあるのだけれど、もう FDそのものが一般的な媒体ではなくなっているし、Kernelのサイズも GENERICだと 3MB位に肥大化しているので、とても 1FDには納まらない。といって過去のバージョンに先祖返りするのも気持ち悪い。

ハードディスクのような稼動部分のないシステムとなると、すぐに思いつくのが CF(Compact Flash)をIDE HDに見立てて組み込むことだけれど(最近だと、SSDか)、これが単価的にはあまり安くならなくて、インターフェースを含めて4千円くらいかかるなら安くなったHDをそのまま使ったほうがいいかということになってしまう。

... なんてことをずっと思っていたのだけれど、最近 FreeNASという FreeBSD系のディストリビューションを見てみたら(名前は前から聞いていたけどさ)、これって、USBメモリや、CFから起動することを想定しているのね。USBから起動してファイルシステムイメージをメモリ上に展開して、起動した後は(たぶん)USBメモリは設定の保存くらいにしか使わないという形態。

USBメモリというと、スティック上のものをすぐにイメージするのだけれど、突起部分がわずか5mmなどという、ほとんど指しっぱなしでも気にならない程度の大きさのものの手軽な値段で市販されているし。
古い機械を使いまわして実験することが多いので、USBブートのことをすっかり忘れていたけれど、これだけ小さければ十分に使い道がありそう。

日本語PDF文書の作成

音声合成、DAISYとくると、次にくるのは、PDF。
すぐに思いつく応用というのは、納品書なり請求書なりを自動的に PDFで作成してくれるシステム。実際、某社の電子株式取引では取引残高報告書とかすべてPDFでの交付になっていて、郵送での送付はまったくない。

日常業務的な応用という範囲ではもう完全に実用になっている分野ではあるのだが、それでもちょっと範囲を広げようとすると、案外すぐに問題に突き当たってしまう。
一つは、縦書きの問題。もう一つはルビの問題。もう一つはunicodeの問題。
unicodeが絡まなければ、ルビ付きの縦書きも日本語化された TeXでほぼ間に合う。
縦書きが絡まなければ、ルビ付きのPDFも、OpenOfficeのPDF作成機能でほぼ間に合う。
(pdf)TeXのunicode対応が完成するのが一番いいのだが。

まあ、結局、縦書き、unicode、ルビ付きという三つの条件をみたす PDF作成方法に、まだ決定版はないと思う。 XSL-FO を使った方法が一番エレガントだと思うが、これもまだ縦書きには未対応だと思う。
( と書いて思い出したけれど、アンテナハウスさんのプロセッサがたしか対応してますね。ただ、他社製品だし、気軽に使うにはちょっと高い。)

これも、試作品は作ってみたので、興味ある人はご照覧あれ。縦書き・2段組・PDFで検索すると、多分最初のページに見つかると思う。

DAISYというデジタル書籍

DAISYというのは、Digital Accessible Information Systemの略で、要するに絵と音のでるデジタル絵本のわけなのだが、簡単に言えば、SMILという同期マルチメディア統合言語(Synchronized Multimedia Integration Language)を使って、文字情報と音声などのマルチメディア情報の同期をとった書籍というもの。

実際には、「音声データの何秒目から何秒目まではテキストのこの部分が対応している」というデータを延々と記述したものが、SMILとなって、それにテキストデータと音声データを合わせたものが、DAISY書籍となるわけだ。卑近な例でいえば、カラオケのテロップのように、音楽と歌詞が同期して表示されるようなものだ。
通常のテープ起こしからはじめると音声とテキストとの対応をいちいち人手でやらなくてはいけないわけだが、音声合成の場合には、テキストと音声の対応は最初から取れているので、この作業を行う必要がない。言い換えると DAISY書籍のデータをつくる労力の9割方以上を完全に省略できるというわけだ。

もちろん、そのためには、「合成音声がそこそこ聞くに耐えるものでなくてはいけない」というのが大前提としてある。GalateaTalkの合成音がこの水準に達しているかというと、何も校正しない状態での GalateaTalkはまだそこまで達していないと思う。 
GalateaTalkなどの音声合成技術は、どちらかといえば、ヒントなしの状態で何%正確に発音できるか?ということを目指していて、「この部分はこのイントネーションでこう発音してというヒントを元に100%に近い発音をしてほしい」というデジタル書籍作成者側のニーズには応えていないと思う。

ローコストでDAISY書籍を製作できるとは言っても、公開するためには著作権の切れた書籍でないと無闇には公開できない。そういう意味では青空文庫をはじめととする、著作権の切れた書籍の電子テキスト化運動には頑張ってほしい。
商品としてのデジタル書籍という観点からは、生の人間の朗読した音声には、到底合成音声は太刀打ちできない。ただ生身の人間の労力だけではカバーしきれない大量の書籍を低価格で作成できるという部分では十分価値があると思う。また、障碍者用の朗読は通常の5割増しから2倍位の速さで朗読したほうがよいという話も聞くので、こういった早口朗読用にも音声合成は向いていると思う。

ダウンロードのページに、作成したサンプルを公開してあるので、興味ある人は聴いてほしい。別のDAISY書籍を作成したときの環境を流用して作成しているので、もしかしたら書籍情報などの細かい点が間違っているかもしれない。

音声合成

音声合成の応用として試作してみたのが、いわゆるIVR(音声応答システム)というもの。
世間の相場はいくらくらいなんだろうと思って、一度、専門の会社に見積もりをとってもらったことがあるのだが、だいたいハードウェア込みで800万円くらいからという返事だった。

見積もってもらったのはかなり前で、いまのようにIP電話などなく、アナログの電話回線用のボードにWindows Serverを載せて、応答音声は音声の専門家による採録ということなのでまあ、それほど競合他社があるわけではなし、そんなものかなと当時は思った。

4~5年前だったと思うが、Asterisk というオープンソースの PBXソフトウェアが現れて、ハードウェア無しに音声応答システムが作れるようになった。サンプルの音声もついていたが、こちらは著作権が絡んでくるし、必要なセンテンスがすべて整っているわけでもないので、この部分を合成音声でまかなえばよい、という発想だった。

ちょうど同じ頃に、GalateaTalkというこれもオープンソースの音声合成エンジンが現れて、道具立てはすべて揃ったというところだ。
はじめは問い合わせに対して、データベースからデータを取り出して、それをリアルタイムに合成しようと思ったが、合成時間が思いのほか長く、実用的なレスポンスがえられなかったので、結局、あらかじめ合成しておいた音声から適当に選んで発生するしかなかった。CPUが速くなった今なら、もしかしたらリアルタイムの合成でも間に合うのかもしれない。

うるさい営業の電話よけに、数ヶ月ほど、この電話応答システムに応答させていたのだが、突然の合成音に驚く人が多かったのと、「~の場合は1、~の場合は2を押して下さい」というアナウンスに、プッシュフォンの音を出せない電話が予想以上に多かったので、元に戻すことにした。何もしないでそのままにしていれば人間がいる電話に転送されるようにしていたのでプッシュフォンの音が出せないと用を為さないというわけではなかったのだが、気短かな人が多いようで、そのまま切ってしまうことが多いようだった。
着信履歴は残っているので、結局、見覚えのある電話番号についてはこちらから折返し電話をすることに。
この時期以降、営業の電話がかなり減ったのは事実だ。

実用的なシステムとして宣伝しなかったのは、一つは、NTTのルータのSIP機能というNTTが宣伝していない機能を使用していたので、いつNTTが仕様変更するかどうかわからなかったのが最大の理由。当時メジャーだった RT200KIとRT200NEとそのバリアント(ONUを内臓したものなど)での動作確認はしていたが、顧客側がNTTからレンタルされる機種を指定することはできないし、「やってみないとわからない」ではやはり商売にはならない。
音声の品質も、かろうじて実用にも使えなくもない、というレベルなので、高い値段をとるなら人間が録音したほうがよい。合成音声の平坦さが、文章をつなぐときにはむしろ都合がよい部分もあるとは思う。

紺屋の白袴

昔話ばかりでもなんなので。

このサイトも実は10数年前からほとんど変っていない。手打ちのHTMLで、規格的にいうと、HTML4.01 Strict の状態がずっと続いていた。アクセシビリティに配慮して、CSS以外の装飾要素は極力排してきたので、見た目少し殺風景な状態だった。最近になって、さすがにこれではいかにも時流に遅れている印象を与えるので、ほんの少し java script を付け加えたり、合成音声を付け加えたりしてみたけれど。

合成音声の方は、結局 IEだとプラグインを要求したりして、それがない状態だとはなはだまとまりのない画面になってしまうので、すぐにやめてしまった。<object>はともかく、<embed>要素を加えると、HTML4.01 準拠とは主張しにくくなるのも一つの理由。

紺屋といっても、ホームページ作成は本来の仕事ではない--CGI作成なら本業だが--ので、白袴状態でもかまわないのだけれど、いまさら、javascriptやflash抜きの pureなhtmlにこだわることもあるまいということで、ちょっと飾ってみた。

顧客の某所がサイトデザインを「もっとかっこいいものに」といって、従来の手打ちのhtmlから、MovableTypeにイメージチェンジしたのも心理的には少し影響している。
トップページを flashで飾って、いわゆる今時風のデザインになったのだが、おかげで、いままで1秒以内に表示できていたのが、5秒ほどかかるようになった。個人的には5秒は長すぎ、これではブロードバンドユーザー以外は読まなくていいと言っているようなものなのだけれど、最近はブロードバンドが普通で、ダイヤルアップはむしろ例外の扱いになったということなのだろう。

そんなことがあって、別のちょっと関わっている団体のサイトを、別のCMS(Content Management System)で全面的に書き換えてみた。MovableTypeはさずがに設計が古臭いし、最近のはXML風に書けるといっても出来上がったものは XML well-formed ですらないので敬遠して、最近人気の Drupalで作ることに。
構想から1ヶ月くらいの間はもっぱら資料集め(といっても、和書ではたったの2冊が出版されているだけで、一冊はほんの入門書、もう一冊は中級後期レベルのもので、必要としているその中間レベルのものは皆無)にかかりきりでコードは一行も書かず、実際の作業はほぼ2週間でデータの移行を含めて完了。カスタムモジュールを5個ほど作る。
当サイトのリニューアルは、その勢いでやったもの。慣れもあるので、実質的な作業はほぼ30分といったところ。
いまどき、この程度なら30分でできるのだね、というのが正直な感想。おかげで、トップページの表示に数秒かかるようになってしまったけれど、キャッシュが利いてくればもう少しレスポンスはよくなるのだろう。

中高生のための数学メーリングリスト

ネットニュースほどオープンではなく、掲示板のようなpull型の配信でもなく、半ば閉じたpush型の通信手段として、メーリングリストという形態が一時期流行った。
優秀な高校生を集めて、数学のメーリングリストを運用したりした。
まあ、いろいろと貴重な体験をさせてもらったと思う。
当時としては、メーリングリストという形態が世間的にはまだものめずらしい時期であったし、インターネットと教育という枠組みで何ができるかを模索している「大人」たちがわんさかいて、「中高生のための」と銘打っているにもかかわらず、参加を希望する大人が大量にいた。
教育系の大人や大学生が多かったのだが、たかが中高生の数学程度なら自分程度でもついていけるとても思って入ってくるのだろう。
実際にはメーリングリスト内で行われている議論は、中高生といえどもそれなりに数学的センスや素養がなければ、ついていけるものではないし、ましてや数学も少しはできました程度の普通の大人が何か適切なアドバイスができるようなレベルでもない。結局、参加してきた大人達は何も発言することすらできずに、むしろ、「発言しない不気味な存在」でしかなかった。
最初はまあ宣伝にもなるしと思って大人も若干受け入れていたのだが、結局お荷物でしかなかったと思う。

数学的な内容でいえば、初等幾何学に関して圧倒的なひらめきをみせてくれたA君には、完全に脱帽状態だった。もちろん現代数学において初等幾何学はもう誰も見向きもしない分野なのでそれがそのまま数学者としてやっていくだけのものになるのかは未知数だけれど、現代数学の主流となる分野に彼が興味を持ったときにどういう花が咲くのかは大いに期待がもてた。(残念ながら、彼は医者の道を選んだらしいが)
もう一つは、フィボナッチ数列の mod 5 の挙動に関する話。議論をしていく過程で、すぐにこれは二次の相互法則の話に密着していることに気が付いて、なるべくそちらの方向に導こうとしたのだけれど、なかなか思い通りに導かれてくれない。「そこに気が付くだけの素質があるなら、もうちょっと行くと違う世界が見えるのに...」とひどく歯痒い思いをした。水場はそこにあるのになかなか飲んでくれない、というところだ。

まあ、ヒントは出しても指導はしない というのが自分のスタンスだったので、結局しりつぼみになってしまった。このメーリングリストのことは、このサイトのどこかにまだ保存してある。トップページからは辿れないが、いまだに検索エンジンがやってくるようなので、検索すればひっかかるのだろう。

fj ネットニュース

今はインターネット=WEBの感があるが、1990年代はまだ、インターネット=メール+ネットニュースという時代だった。
プロバイダという制度が導入されてインターネットが大衆化するとともに、従来の実名文化だったインターネットという社会に、匿名文化が大量に流れ込んできた。Googleなどを経由してネットニュースが気軽に読めるようになったのは便利になったが、同時に 2ch をはじめとする匿名文化が入り込んできて、fj(当時の日本を代表するネットニュースグループ)は急速にその文化の香りを失うことになる。
情報発信の手段としてネットニュースでなくとも他の手段がいくらでもあるということで、他の媒体(まあ、掲示板なり、今ならmixiのようなコミュニティなり)に散らばっていったということだ。
WHOIS情報が乱用されて、WHOIS情報が匿名化されていったのもこの頃。
悪貨が良貨を駆逐した時期だったと思う。

hamaint という名前

会社を作った当時は、第五世代コンピュータの話題がまだ華やかかりし頃で、人工知能的なこと(認知心理的なこと)を射程におきたいということで、今の会社名にした。名前がちょっと長くて舌を噛みそうな点については、少しばかり反省している。

設立当時は資本金500万円で、最初の仕事が通信ソフトウェアの開発でこれが約500万円位の売り上げになった。その内の300万円位を当時のSun3というWorkStationの購入に当ててunixに浸かるのが、現在の会社を大まかに決めているといってもまちがいない。

当時は internet も まだ uucp が主流の頃で、unixユーザー会でも、IP接続って何?といった話題がホットに語られていた。 うちの会社も富士通のネットワークサービス(これは、SunのWorkStationを購入した顧客相手に提供されていたもの)に接続して、そのuucp接続名に使っていた hamaint をそのまま、今のドメイン名に使用している。

whois情報だと、今のhamaint.co.jpは、1996年取得となっているが、実際に使い出したのはもう少し早くて、多分1991年頃にはこのドメイン名を使っていたように思う。今の「インターネット接続業者」という枠組みができたのもその頃で、当時は、ドメイン名の取得は基本的には無料で、申請すれば誰でも使える状態だった。唯、1年以上繋がっていない状態が続くとドメイン名が無効になってしまうという仕組みだったので、たまたま接続できない状況が続いて一旦無効になってしまったのを再取得したのが1996年ということだ。

JPNICハンドルの方は別の登録にも使用していたのでこちらは当初のまま残っている。ハンドル名のEK001JPというのは、イニシャルがEKのユーザーの中では最初に登録されたユーザーだということで、これはちょっとした自慢の種ではある。

 

 

Publish or Perish

学生の頃に、『出版するか消滅するか』というフレーズが言われていた。要するに、研究者として残りたければ、論文を書きなさい、ということをややストレートに表現したものだ。

もちろん、昔も今も同じフレーズは生き続けているのだろうことは、想像に難くない。

半ば固定のクライアント相手の商売をしていて、とりたてて営業活動をすることもないまま、特に publish する必然性もあまりなくすごしていたが、やはり publish の活動もせねばなるまい、という心境に傾いてきた。

さりとて、今の職業は「他人よりはうまくやってみせるさ」という意識はあるものの、「誰よりもうまく」という気合はないし、商売としては、「そこそこいいものを」「そこそこはやく」「そこそこ安く」ということの方が優先されるので、それほど大層なことが書ける気もしない。

まあ、日頃の行いの中で、気のついた事柄を、ぼちぼちと書きとめておくことにする。

1 2