[BACK]Return to genkou19991125.tex CVS log [TXT][DIR] Up to [local] / OpenXM / doc

Diff for /OpenXM/doc/Attic/genkou19991125.tex between version 1.30 and 1.77

version 1.30, 1999/12/21 06:59:42 version 1.77, 1999/12/24 19:59:39
Line 1 
Line 1 
 \documentclass{jarticle}  \documentclass{jarticle}
   
 \title{タイトル未定}  %% $OpenXM: OpenXM/doc/genkou19991125.tex,v 1.76 1999/12/24 19:01:00 tam Exp $
 \author{  
 前川 まさひで,  \usepackage{jssac}
 野呂 正行,  \title{
 小原 功任, \\  1. 意味もない修飾過剰な語句は排除しましょう。\\
 奥谷 幸夫,  2. せっかく fill しているのをいじらないでくれ。\\
 高山 信毅,  3. 田村が遊んでばかりでおればかり仕事をしているのはどう考えても不公平だ。
 田村 恭士  なんで仕事をしないのか、いい加減仕事をしろ、田村。
   %↑すみません、家で御飯食べてました。
 }  }
 \date{1999年11月25日}  
 %\pagestyle{empty}  
   
   \author{奥 谷   行 央\affil{神戸大学大学院自然科学研究科}
                   \mail{okutani@math.sci.kobe-u.ac.jp}
     \and  小 原   功 任\affil{金沢大学理学部}
                   \mail{ohara@kappa.s.kanazawa-u.ac.jp}
     \and  高 山   信 毅\affil{神戸大学理学部}
                   \mail{takayama@math.sci.kobe-u.ac.jp}
     \and  田 村   恭 士\affil{神戸大学大学院自然科学研究科}
                   \mail{tamura@math.sci.kobe-u.ac.jp}
     \and  野 呂   正 行\affil{富士通研究所}
                   \mail{noro@para.flab.fujitsu.co.jp}
     \and  前 川   将 秀\affil{神戸大学理学部}
                   \mail{maekawa@math.sci.kobe-u.ac.jp}
   }
   \art{}
   
 \begin{document}  \begin{document}
 \maketitle  \maketitle
   
 \section{OpenXMとは}  \section{OpenXMとは}
   
 OpenXM は数学プロセス間でメッセージを交換するための規約である。数学プロ  OpenXM は数学プロセス間でメッセージを交換するための規約である。
 セス間でメッセージをやりとりさせることにより、ある数学プロセスから他の数  数学プロセス間でメッセージをやりとりすることにより、
 学プロセスを呼び出して計算を行なったり、他のマシンで計算を行なわせたりす  ある数学プロセスから他の数学プロセスを呼び出して計算を行なったり、
 ることが目的である。なお、 OpenXM とは Open message eXchange protocol  他のマシンで計算を行なわせたりすることが目的である。
 for Mathematics の略である。  なお、 OpenXM とは Open message eXchange protocol for Mathematics の略である。
   OpenXM の開発の発端は野呂と高山により、
   asir と kan/sm1 を相互に呼び出す機能を実装したことである。
   
   初期の実装では、相手側のローカル言語の文法に従った文字列を送っていた。
   この方法では相手側のソフトが asir なのか kan/sm1 なのかを判別するなどして、
   相手側のローカル言語の文法に合わせた文字列を作成しなければならない。
   このローカル言語の文法に従った文字列を送る方法は、
   効率的であるとはいい難いが、使いやすいとも言える。
   
 OpenXM の開発の発端は野呂正行と高山信毅により、 asir と kan/sm1 を  現在の OpenXM 規約では共通表現形式によるメッセージを用いている。
 相互に呼び出す機能を実装したことである。  上記の文字列を送る方法の利点を生かすため、
 \footnote{この段落必要?}  OpenXM 規約では共通表現形式の中の文字列として、
 発端となった asir と kan/sm1 での実装時には、  ローカル言語の文法に従った文字列を用いたメッセージの交換も可能となっている。
 お互いに相手側のコマンド文字列を送っていた。  
 この方法は現在の OpenXM 規約でも形を変えて可能ではあるが、  
 使いやすい反面、効率的であるとはいい難い。  
 さらに、この方法では相手側のソフトが asir なのか kan/sm1 なのかを  
 判別して、相手側に合わせてコマンド文字列を作成する必要がある。  
   
 これ以外の方法として、  OpenXM 規約では通信の方法に幾らかの自由度があるが、
 OpenXM 規約では共通表現形式によるメッセージも用意している。  現在のところは TCP/IP を用いた通信しか実装されていない。
 OpenXM 規約独自のデータ形式である CMO 形式(Common Mathematical Object format)  そこで、この論文では具体的な実装は TCP/IP を用いていると仮定する。
 以外にも、 MP や OpenMath の XML, binary 表現形式といった他の形式をも  
 扱えるようにしてある。  
 なお、現在の OpenXM 規約では、  
 前述のコマンド文字列も CMO 形式などの何らかのデータ形式の中の  
 文字列として表現して送る必要がある。  
   
 \section{OpenXM の計算モデル}  \section{OpenXM のメッセージの構造}
   
 {\Huge この節では計算モデルの話をしなければいけませんよ、田村君}  通信の方法によってメッセージの構造は変わる。
   前節で仮定したとおり、この論文では TCP/IP の場合についてのみ説明を行なう。
   
 OpenXM 規約でのメッセージの交換はサーバとクライアントの間で行なわれる。  OpenXM 規約で規定されているメッセージはバイトストリームとなっており、
 サーバはスタックマシンであると仮定されており、サーバがクライアントから受  次のような構造になっている。
 け取ったメッセージはすべてスタックに積まれる。OpenXM のメッセージの中に  
 はサーバに行なわせたい動作に対応するデータがあり、このメッセージを受け取っ  
 たサーバはそれに対応する動作を行なうことが期待されている。ただし、サーバ  
 は命令されない限り何も動作を行なおうとはしない。  
   
   \begin{tabular}{|c|c|}
   \hline
   ヘッダ  & \hspace{10mm} ボディ \hspace{10mm} \\
   \hline
   \end{tabular}
   
 \section{OpenXM のメッセージの構造}  ヘッダの長さは 8 バイトであると定められている。
   ボディの長さはメッセージごとに異なっているが、
   長さは $0$ でもよい。
   
 {\Huge この節では構造の話をしなければいけませんよ、田村君}  ヘッダは次の二つの情報を持っている。
   \begin{enumerate}
   \item   前半の 4 バイト。メッセージの種類を表わす識別子であり、
           タグと呼ばれる。
   \item   後半の 4 バイト。メッセージにつけられた通し番号である。
   \end{enumerate}
   それぞれの 4 バイトは 32 ビット整数とみなされて扱われる。
   この場合に用いられる整数の表現方法については後述するが、
   基本的に表現方法はいくつかの選択肢から選ぶことが可能となっており、
   またその選択は通信路の確立時に一度だけなされることに注意しなければならない。
   現在のOpenXM 規約では、タグ(整数値)として
   以下のものが定義されている。
   
 OpenXM のメッセージはバイトストリームであり、次のような構造を持つ。  
 \begin{verbatim}  \begin{verbatim}
 ヘッダ  ボディ  #define OX_COMMAND              513
   #define OX_DATA                 514
   #define OX_SYNC_BALL            515
   #define OX_DATA_WITH_LENGTH     521
   #define OX_DATA_OPENMATH_XML    523
   #define OX_DATA_OPENMATH_BINARY 524
   #define OX_DATA_MP              525
 \end{verbatim}  \end{verbatim}
 ヘッダの長さは8バイトであると定められている。ボディの長さはメッセージご  
 とに異なる($0$でもよい)。  ボディの構造はメッセージの種類によって異なる。
 ヘッダは次の二つの情報を持つ。  タグが OX\_COMMAND となっているメッセージはスタックマシンへの命令であり、
   それ以外のメッセージは何らかのオブジェクトを表している。
   この論文では OX\_DATA と OX\_COMMAND で識別される
   メッセージについてのみ、説明する。
   
   既存のメッセージでは対応できない場合は、新しい識別子を定義することで新し
   い種類のメッセージを作成することができる。この方法は各数学ソフトウェアの
   固有の表現を含むメッセージを作成したい場合などに有効である。新しい識別子
   の定義方法については、\cite{OpenXM-1999} を参照すること。
   
   \section{OpenXM の計算モデル}
   
   OpenXM 規約での計算とはメッセージを交換することである。また、 OpenXM 規
   約ではクライアント・サーバモデルを採用しているので、メッセージの交換はサー
   バとクライアントの間で行なわれる。クライアントからサーバへメッセージを送
   り、クライアントがサーバからメッセージを受け取ることによって計算の結果が
   得られる。このメッセージのやりとりはクライアントの主導で行われる。つまり、
   クライアントは自由にメッセージをサーバに送付してもよいが、サーバからは自
   発的にメッセージが送付されることはない。この原理はサーバはスタックマシン
   であることで実現される。スタックマシンの構造については \ref{sec:oxsm} 節
   で述べる。
   
   サーバがクライアントから受け取ったオブジェクト(つまり OX\_COMMAND でない
   メッセージのボディ)はすべてスタックに積まれる。スタックマシンへの命令
   (OX\_COMMAND で識別されるメッセージのボディ)を受け取ったサーバは命令に対
   応する動作を行なう。このとき、命令によってはスタックからオブジェクトを取
   り出すことがあり、また(各数学システムでの)計算結果をスタックに積むことが
   ある。もし、与えられたデータが正しくないなどの理由でエラーが生じた場合に
   はサーバはエラーオブジェクトをスタックに積む。計算結果をクライアントが得
   る場合にはスタックマシンの命令 SM\_popCMO または SM\_popString をサーバ
   に送らなければならない。これらの命令を受け取ってはじめて、サーバからクラ
   イアントへメッセージが送られる。
   
   {\Huge 以下、書き直し}
   
   まとめると、クライアントがサーバへメッセージを送り、
   計算の結果を得るという手順は以下のようになる。
   
 \begin{enumerate}  \begin{enumerate}
 \item 前半の4バイト。タグと呼ばれ、メッセージの種類を表わす識別子である。  \item
 \item 後半の4バイト。メッセージにつけられた通し番号である。  まず、クライアントがサーバへオブジェクトを送る。サーバは送られてきたオブ
   ジェクトをスタックに積む。
   \item
   クライアントがサーバに命令を送ると、サーバは必要なだけスタックからデータ
   を取り出し、実行した結果をスタックに積む。
   %って書いてるけど、命令がSM\_popCMO とか SM\_shutdown の場合は?
   \item
   最後に SM\_popCMO もしくは SM\_popString をサーバへ送ると、
   サーバはスタックから計算結果の入っているデータを取り出し、
   クライアントへ送出する。
 \end{enumerate}  \end{enumerate}
   
 それぞれの4バイトは32ビット整数とみなされて処理される。  \section{OpenXM スタックマシン}\label{sec:oxsm}
 この場合に用いられる整数の表現方法については後述するが、基本的に  
 表現方法はいくつかの選択肢から選ぶことが可能であり、  
 また選択は通信路の確立時に一度だけなされることに注意しておこう。  
   
 {\Huge 以下、書き直してね。}  OpenXM 規約ではサーバはスタックマシンであると定義している。以下、OpenXM
   スタックマシンと呼ぶ。この節ではOpenXM スタックマシンの構造について説明
   しよう。
   
 ボディの中のデータがどのように格納されているかは  まず、OpenXM 規約は通信時にやりとりされる共通のデータ形式については規定
 各データ形式がそれぞれ独立に決められるようになっている。  するが、OpenXM スタックマシンがスタックに積む、オブジェクトの構造までは
 もし、 OpenXM 規約でメッセージのやりとりを行ないたいが、  規定しない。つまり、オブジェクトの構造は各数学システムごとに異なっている
 まだ規約で定義されていないデータ形式を使いたい場合は、  ということである。このことは通信路からデータを受け取った際に、各数学シス
 タグをまだ使われてなさそうな値  テムが固有のデータ構造に変換してからスタックに積むことを意味する。この変
 (システム固有の表現のために推奨されている値がある)  換は1対1対応である必要はない。
 に設定し、 ボディの部分にデータを埋め込めばよい。  
 なお、すべてのメッセージに ボディが必要というわけではなく、  
 ボディのないメッセージも OpenXM 規約には存在することに  
 注意しなければならない。  
   
 サーバに対する動作に対応したデータは SM 形式として定義されている。  次に OpenXM スタックマシンの命令コードについて説明する。OpenXM スタック
 SM 形式以外のデータでは、サーバは受け取ったデータをスタックに積む  マシンにおけるすべての命令は4バイトの長さを持つ。OpenXM 規約の他の規定と
 以外の動作をしないことになっている。  同様に、4バイトのデータは32ビット整数と見なされるので、この論文でもその
 つまり、 SM 形式のデータがデータを受け取る以外の動作を  表記にしたがう。OpenXM スタックマシンに対する命令はスタックに積まれるこ
 サーバに行なわせる唯一のデータ形式である。  とはない。現在のところ、OpenXM 規約では以下の命令が定義されている。
 このデータを受け取る以外の動作の中には、  
 データになんらかの加工を施す動作も入っている。  
 このデータになんらかの加工を施す動作の中には  
 数学的な演算を行なう動作も含まれている。  
 以後、データになんらかの加工を施す動作のことを計算と呼ぶことにする。  
   
 \section{OpenXM の計算の進行方法}  \begin{verbatim}
   #define SM_popSerializedLocalObject               258
   #define SM_popCMO                                 262
   #define SM_popString                              263
   
 OpenXM における計算とはメッセージの交換のことである。既に計算モデルの節  #define SM_mathcap                                264
 で説明したが(説明されているはずである)、OpenXM はサーバ・クライアントモ  #define SM_pops                                   265
 デルを採用していて、サーバはスタックマシンの構造を持つ。サーバが行うのは  #define SM_setName                                266
 基本的に次の事柄に限られる。クライアントからメッセージを送られるとサーバ  #define SM_evalName                               267
 は、まずメッセージの識別子を調べ、OX\_COMMAND でなければスタックに積む。  #define SM_executeStringByLocalParser             268
 OX\_COMMAND であればメッセージのボディからスタックマシンのオペコードを取  #define SM_executeFunction                        269
 りだし、あらかじめ規約で定められたアクションを起こす。  #define SM_beginBlock                             270
   #define SM_endBlock                               271
   #define SM_shutdown                               272
   #define SM_setMathCap                             273
   #define SM_executeStringByLocalParserInBatchMode  274
   #define SM_getsp                                  275
   #define SM_dupErrors                              276
   
 上の説明でわかるように、サーバはクライアントからの指示なしに、自らメッセー  #define SM_DUMMY_sendcmo                          280
 ジを送ることはない(例外? ox\_asir の mathcap)。  #define SM_sync_ball                              281
   
 {\Huge 以下、書き直してね、田村君}  #define SM_control_kill                          1024
   #define SM_control_to_debug_mode                 1025
   #define SM_control_exit_debug_mode               1026
   #define SM_control_ping                          1027
   #define SM_control_start_watch_thread            1028
   #define SM_control_stop_watch_thread             1029
   #define SM_control_reset_connection              1030
   \end{verbatim}
   
   %以下、どういうときに結果をスタックに積むかエラーの場合どうするかの説明が
   %必要であろう。
   
 % クライアントがサーバへなんらかの計算を行なわせる場合、  スタックマシンに対する命令の中には実行の結果が存在するものがある。
 % クライアントからサーバへ計算させたいデータをメッセージとして送り、  結果が存在する命令を実行した場合、サーバはその結果をスタックに積む。
 % そしてその結果をサーバからメッセージで受け取ることによって計算は行なわれる。  たとえば、 SM\_executeStringByLocalParser は
 % ただし、サーバは結果の送信すらも命令されなければ行なうことはなく、  スタックに積まれているオブジェクトを
 % クライアントは結果を受け取らずにサーバに次々と  サーバ側のローカル言語の文法に従った文字列とみなして計算を行なうが、
 % 計算を行なわせることも可能である。  行なった結果はローカル言語で記述した文字列でスタックに積まれる。
   なお、命令の実行中にエラーが起こり、結果が得られなかった場合には、
   エラーオブジェクトがスタックに積まれる。
   
 サーバがクライアントから受け取ったメッセージはすべてスタックに積まれる。  
 ただし、このままでは受け取ったメッセージに含まれるデータを  
 スタックに積み上げていくだけで、サーバは計算を行なおうとはしない。  
 次いでサーバに行なわせたい動作に対応したデータを送ると、  
 初めてサーバは計算などの、なんらかの動作を行なう。  
 このとき、必要があればサーバはスタックから必要なだけデータを取り出す。  
 ここで、クライアントからの命令による動作中にたとえエラーが発生したとしても  
 サーバはエラーオブジェクトをスタックに積むだけで、  
 明示されない限りエラーを返さないことに注意しなければならない。  
   
 結果が生じる動作をサーバが行なった場合、  \section{CMO のデータ構造}\label{sec:cmo}
 サーバは動作の結果をスタックに積んでいる。  
 サーバに行なわせた動作の結果をクライアントが知りたい場合、  
 スタックからデータを取り出し送信を行なう命令に対応した SM 形式のデータを  
 サーバ側へ送ればよい。  
   
 クライアントがサーバへ計算を行なわせ、結果を得るという手順を追っていくと、  OpenXM 規約では、数学的オブジェクトを表現する方法として CMO 形式(Common
 次のようになる。  Mathematical Object format)を定義している。この CMO 形式にしたがったデー
   タは、識別子が OX\_DATA であるようなメッセージのボディになることを想定し
   ている。
   
 \begin{enumerate}  CMO 形式におけるデータ構造は次のような構造をもつ。
 \item   まず、クライアントがサーバへ計算させたいデータを送る。  
         サーバは送られてきたデータをスタックに積む。  
 \item   クライアントがサーバに「計算を行なう動作に対応したデータ」を  
         送ると、サーバは必要なだけスタックからデータを取り出し、  
         実行した計算の結果をスタックに積む。  
 \item   最後に「データを取り出し送信を行なう命令に対応したデータ」を  
         サーバへ送ると、サーバはスタックから計算結果の入っている  
         データを取り出し、クライアントへ送出する。  
 \end{enumerate}  
   
   \begin{tabular}{|c|c|} \hline
   ヘッダ        & \hspace{10mm} ボディ \hspace{10mm} \\ \hline
   \end{tabular}
   
 \section{CMO のデータ構造}  ヘッダは4バイトである。ボディの長さはそれぞれのデータによって異なるが、
   0でもよい。
   
 OpenXM 間でやりとりされるメッセージを実際に作成する場合、  メッセージと同様にヘッダは4バイト単位に管理される。すなわち、CMO ではヘッ
 CMO 形式で定義されている多倍長整数を理解しておくと、  ダは一つだけの情報を含む。この4バイトのヘッダのことをタグともいう。さて、
 CMO 形式の他のデータ構造だけでなく、 OX 形式、 SM 形式のデータを  CMO では、タグによってボディの論理的構造が決定する。すなわち、タグはそれ
 理解する助けになると思えるので、 CMO 形式の多倍長整数の  ぞれのデータ構造と1対1に対応する識別子である。それぞれの論理的構造は
 データ構造について説明する。  \cite{OpenXM-1999} に詳述されている。現在の OpenXM 規約では以下の CMO が
   定義されている。
   
 CMO 形式で定義されているデータは多倍長整数以外にも  \begin{verbatim}
 文字列やリスト構造などがある。どのようなデータであるかは  #define CMO_ERROR2  0x7f000002
 データの先頭にあるタグを見れば判別できるようになっている。  #define CMO_NULL    1
 これはメッセージのデータの判別の仕方とおなじである。  #define CMO_INT32   2
 なお、タグは各データ毎に 32 bit の整数で表されており、  #define CMO_DATUM   3
 多倍長整数は 20 となっている。  #define CMO_STRING  4
 ここで 32 bit の整数の表現方法について説明する必要がある。  #define CMO_MATHCAP 5
 OpenXM ではバイト列で 32 bit の整数 20 を  
 {\tt 00 00 00 14} と表す方法と {\tt 14 00 00 00} と表す方法がある。  
 この表現方法の違いはクライアントとサーバの最初の接続時に  
 双方の合意で決定することになっている。  
 なお、合意がない場合には  
 前者の表現方法(以後、この表現方法を network byte order と呼ぶ)を  
 使うことになっている。  
 また、負の数を表現する必要があるときには、  
 2 の補数表現を使うことになっている。  
   
 表現したい多倍長整数の絶対値を 2 進数で表した場合の桁数を $n$ と  #define CMO_START_SIGNATURE      0x7fabcd03
 したとき、次にくるデータは $[(n+31)/32]$ を 32 bit の整数となる。  #define CMO_ARRAY                16
 これは多倍長整数の絶対値を $2^{32}$ 進数で表した場合の桁数ととってもよい。  #define CMO_LIST                 17
 ただし、表現したい数が負の場合は $[(n+31)/32]$ を 32 bit の整数で表した値を  #define CMO_ATOM                 18
  2 の補数表現で負にして、正の場合と区別する。  #define CMO_MONOMIAL32           19
   #define CMO_ZZ                   20
   #define CMO_QQ                   21
   #define CMO_ZERO                 22
   #define CMO_DMS_GENERIC          24
   #define CMO_DMS_OF_N_VARIABLES   25
   #define CMO_RING_BY_NAME         26
   #define CMO_RECURSIVE_POLYNOMIAL 27
   #define CMO_LIST_R               28
   
 表現したい多倍長整数の絶対値が $2^{32}$ 進数で $(b_0 b_1 ... b_k)_{2^{32}}$  #define CMO_INT32COEFF                 30
 と表せるとき、次にくるデータは $b_0$, $b_1$, $\cdots$, $b_k$ を  #define CMO_DISTRIBUTED_POLYNOMIAL     31
 それぞれ 32 bit の整数で表現した値となる。  #define CMO_POLYNOMIAL_IN_ONE_VARIABLE 33
 %以下は書き直しの必要があるかも...  #define CMO_RATIONAL                   34
 なお、 GNU MP LIBRARY を用いると、  
 C 言語から多倍長整数や任意精度浮動小数を扱うことができる。  
 $b_0$, $b_1$, $\cdots$, $b_k$ をそれぞれ 32 bit 整数で表現した値は  
 この GNU MP LIBRARY で用いられている多倍長整数で使われている形式を  
 参考にして合わせてある。  
   
 ここで具体例をだそう。  #define CMO_64BIT_MACHINE_DOUBLE           40
 $4294967298 = 1 \times 2^{32} + 2$ を network byte order の多倍長整数で  #define CMO_ARRAY_OF_64BIT_MACHINE_DOUBLE  41
 表現すると、  #define CMO_128BIT_MACHINE_DOUBLE          42
 \begin{center}  #define CMO_ARRAY_OF_128BIT_MACHINE_DOUBLE 43
         {\tt 00 00 00 14 00 00 00 02 00 00 00 02 00 00 00 01}  
 \end{center}  
 となる。また、同じ表現方法で $-1$ を表現すると、  
 \begin{center}  
         {\tt 00 00 00 14 ff ff ff ff 00 00 00 01}  
 \end{center}  
 となる。  
   
   #define CMO_BIGFLOAT          50
   #define CMO_IEEE_DOUBLE_FLOAT 51
   
 \section{MathCap について}  #define CMO_INDETERMINATE 60
   #define CMO_TREE          61
   #define CMO_LAMBDA        62
   \end{verbatim}
   
 サーバおよびクライアント双方ともに OpenXM で規定されている  この中で CMO\_ERROR2, CMO\_NULL, CMO\_INT32, CMO\_DATUM, CMO\_STRING,
 メッセージの中のデータ形式をすべて受け取れるわけではない。  CMO\_MATHCAP, CMO\_LIST で識別されるオブジェクトは最も基本的なオブジェ
 しかも、 OpenXM 規約で規定されているデータ形式だけが  クトであって、すべての OpenXM 対応システムに実装されていなければならない。
 受渡しに使われるというわけではない。  
 そこで、 OpenXM では相手側が受け取ることができるデータ形式を  
 収得する方法を用意している。  
   
 CMO 形式で定義されている MathCap データは  これらについての解説を行う前に記法について、少し説明しておく。
 %理解可能なメッセージの  この論文では、大文字で CMO\_INT32 と書いた場合には、上記で定義した識別子
 受け取ることができるデータ形式を表すデータであり、  を表わす。また CMO\_INT32 で識別されるオブジェクトのクラス(あるいはデー
 要求されればサーバはサーバ自身の MathCap データをスタックに積む。  タ構造)を cmo\_int32 と小文字で表わすことにする。
 また、クライアントから MathCap データをサーバへ送ることもでき、  
 MathCap データをサーバとクライアントの間で交換することによって、  
 お互いに相手側が受け取ることができないデータ形式で  
 メッセージを送ってしまうのを防ぐことができる。  
 なお、 MathCap データの中では CMO 形式で定義されている  
 32 bit 整数、文字列、リスト構造が使われており、  
 MathCap データに含まれている内容を理解できるためには  
 必然的にこれらも理解できる必要がある。  
   
 OpenXM 対応版の asir サーバである ox\_asir が返す MathCap を以下に示す。  さて cmo を表現するための一つの記法を導入する。この記法は CMO expression
   と呼ばれている。その正確な形式的定義は \cite{OpenXM-1999} を参照すること。
   
   まず CMO expssion は Lisp 風表現の一種で、 cmo を括弧で囲んだリストとし
   て表現する。それぞれの要素はカンマで区切る。
   例えば、
   \begin{quote}
   (17, {\sl int32}, (CMO\_NULL), (2, {\sl int32} $n$))
   \end{quote}
   は CMO expression である。ここで、小文字の斜体で表された``{\sl int32}''
   は 4バイトの任意のデータを表す記号であり、``{\sl int32} $n$'' は同じく 4
   バイトのデータであるが以下の説明で $n$ と表すことを示す。また数字 17, 2
   などは 4バイトのデータで整数値としてみたときの値を意味する。CMO\_NULL は
   識別子(すなわち数字 1 と等価)である。この記法から上記のデータは 20 バイ
   トの大きさのデータであることが分かる。
   なお、このデータは cmo ではないことに注意してほしい。
   %なお、 CMO expression で表現できていても、
   %それが CMO であることとは無関係である。
   
   さて、この記法のもとで cmo\_int32 を次のデータ構造を持つと定義する。
   \begin{quote}
   cmo\_int32 := (CMO\_INT32,  {\sl int32} $a$)
   \end{quote}
   
   %{\Huge 同様に cmo\_string, cmo\_list などを定義}
   
   これは cmo の 32 ビット整数 $a$ を表す。
   他のオブジェクトを定義するために、
   以後 ``{\sl string} $s$'' を文字列 $s$ 、
   ``{\sl cmo} $ob$'' を cmo のオブジェクト $ob$ とする。
   これを用いて、 cmo\_string, cmo\_list を定義する。
   
   \begin{quote}
   cmo\_string := (CMO\_STRING, {\sl int32} $len$, {\sl string} $str$) \\
   cmo\_list := (CMO\_LIST, {\sl int32} $n$, {\sl cmo} $ob_1$,
                   {\sl cmo} $ob_2$, $\cdots$,{\sl cmo} $ob_n$)
   \end{quote}
   
   これはそれぞれ長さ $len$ の文字列 $str$ と、
   $ob_1$, $ob_2$, $\cdots$, $ob_n$ からなる長さ $n$ のリストを表す。
   
   
   % ここで 32 bit の整数の表現方法について触れておく。
   % OpenXM 規約ではバイトストリームで 32 bit の整数 20 を
   % {\tt 00 00 00 14} と表す方法と {\tt 14 00 00 00} と表す方法がある。
   % この表現方法の違いはクライアントとサーバの最初の接続時に
   % 双方の合意で決定することになっている。
   % なお、合意がない場合には前者の表現方法
   % (以後、この表現方法をネットワークバイトオーダーと呼ぶ)を
   % 使うことになっている。
   % また、負の数を表現する必要があるときには、
   % 2 の補数表現を使うことになっている。
   
   % 先ほどの、 (CMO\_INT32, 123456789) をネットワークバイトオーダーで
   % バイト列に直すと、
   % \begin{center}
   %       {\tt 00 00 00 02 07 5b cd 15}
   % \end{center}
   % となり、
   % (CMO\_STRING, 6, ``OpenXM'') は
   % \begin{center}
   %       {\tt 00 00 00 04 00 00 00 06 4f 70 65 6e 58 4d}
   % \end{center}
   % となる。
   
   % CMO 形式の多倍長整数は、 Gnu MPライブラリ等を参考にしており、
   % 符号付き絶対値表現を用いている。
   % タグ以降の形式は次のようになる。
   
   % \begin{tabular}{|c|c|c|c|c|} \hline
   % $f$ & $b_0$ & $b_1$ & $\cdots$ & $b_{n-1}$ \\ \hline
   % \end{tabular}
   
   % ここで、 1 つの枠は 4 バイトを表し、
   % $f$ は符号付き 32 ビット整数を、
   % $b_0$, $b_1$, $\cdots$, $b_{n-1}$ は符号なし 32 ビット整数を表している。
   % さらに、 $|f| = n$ が成り立たなければならない。
   % このオブジェクトは
   % \[ \mbox{sgn}(f) \times \{ b_0 (2^{32})^0 + b_1 (2^{32})^1 + \cdots
   %       + b_{n-1} (2^{32})^{n-1} \}     \]
   % という整数であると定義されている。
   % ただし、
   % \[ \mbox{sgn}(f) = \left\{ \begin{array}{ll}
   %         1       & f>0 \\
   %         0       & f=0 \\
   %         -1      & f<0 \\ \end{array} \right.  \]
   % である。
   
   % ここで具体例をだそう。
   % $4294967298 = 1 \times 2^{32} + 2$ を CMO 形式の
   % ネットワークバイトオーダー、多倍長整数で表現すると、
   % \begin{center}
   %       {\tt 00 00 00 14 00 00 00 02 00 00 00 02 00 00 00 01}
   % \end{center}
   % となる。また、同じ表現方法で $-1$ を表現すると、
   % \begin{center}
   %       {\tt 00 00 00 14 ff ff ff ff 00 00 00 01}
   % \end{center}
   % となる。
   
   
   \section{mathcap について}
   
   OpenXM 規約では、通信時に用いられるメッセージの種類を各ソフトウェアが制
   限する方法を用意している。これは各ソフトウェアの実装によってはすべてのメッ
   セージをサポートするのが困難な場合があるからである。また、各ソフトウェア
   でメッセージの種類を拡張したい場合にも有効である。この制限(あるいは拡張)
   は mathcap と呼ばれるデータ構造によって行われる。この節では mathcap のデー
   タ構造と、具体的なメッセージの制限の手続きについて説明する。
   
   では、手続きについて説明しよう。
   
   第一にサーバの機能を制限するには次のようにする。クライアントが mathcap
   オブジェクトをサーバへ送ると、サーバは受け取ったmathcap をスタックに積む。
   次にクライアントが命令 SM\_setMathCap を送ると、サーバはスタックの最上位
   に積まれている mathcap オブジェクトを取り出し、mathcap で設定されていな
   いメッセージをクライアントへ送らないように制限を行う。
   
   第二にクライアントを制限するには次のようにする。クライアントがサーバに命
   令 SM\_mathcap を送ると、サーバは mathcap オブジェクトをスタックに積む。
   さらに命令 SM\_popCMO を送ると、サーバはスタックの最上位のオブジェクト
   (すなわち mathcap オブジェクト)をボディとするメッセージをクライアントに
   送付する。クライアントはそのオブジェクトを解析して、制限をかける。
   
   次に mathcap のデータ構造について説明する。
   mathcap は CMO の一種であるので、すでに説明したように \\
   \begin{tabular}{|c|c|} \hline
   ヘッダ        & \hspace{10mm} ボディ \hspace{10mm} \\ \hline
   \end{tabular} \\
   の構造を持ちヘッダの値は 5 である(\ref{sec:cmo} 節を参照のこと)。
   ボディは cmo\_list オブジェクトでなければならない。
   
   %\begin{quote}
   %       cmo\_mathcap := (CMO\_MATHCAP,{\sl cmo} obj)
   %\end{quote}
   
   さて、mathcap オブジェクトのボディの cmo\_list オブジェクトは以下の条件を
   満たすことを要求される。
   
   まず、その cmo\_list オブジェクトは少なくともリスト長が 3 以上でなければ
   ならない。
   
   \begin{quote}
           (CMO\_LIST, {\sl int32} $3$,
                   {\sl cmo} $A$, {\sl cmo} $B$, {\sl cmo} $C$)
   \end{quote}
   %\[     \begin{tabular}{|c|c|c|} \hline
   %       $A$ & $B$ & $C$ \\ \hline
   %       \end{tabular}   \]
   
   第一要素 $A$ はまた cmo\_list であり、リスト長は 4 以上、
   $a_1$ は 32 ビット整数でバージョンナンバーを、
   $a_2$ は文字列でシステムの名前を表すことになっている。
   \begin{quote}
           (CMO\_LIST, {\sl int32} $4$,
                   {\sl cmo\_int32} $a_1$, {\sl cmo\_string} $a_2$,
                   {\sl cmo} $a_3$, {\sl cmo} $a_4$)
   \end{quote}
   %\[     \begin{tabular}{|c|c|} \hline
   %       $a_1$ & $a_2$   \\ \hline
   %       \end{tabular}   \]
   
   2 番目の要素 $B$ の部分は次のようなリスト構造をしている。
   この $b_1$, $b_2$, $\cdots$, $b_n$ はすべて 32 ビットの整数である。
   スタックマシンへの命令はすべて 32 ビットの整数で表しており、
   各 $b_i$ は利用可能な命令に対応する 32 ビットの整数となっている。
   \begin{quote}
           (CMO\_LIST, {\sl int32} $n$,
                   {\sl cmo\_int32} $b_1$, {\sl cmo\_int32} $b_2$,
                   $\cdots$, {\sl cmo\_int32} $b_n$)
   \end{quote}
   %\[     \begin{tabular}{|c|c|c|c|} \hline
   %       $b_1$ & $b_2$ & $\cdots$ & $b_n$        \\ \hline
   %       \end{tabular}   \]
   
   3 番目の要素 $C$ は以下のようなリスト構造をしている。
   \begin{quote}
           (CMO\_LIST, {\sl int32} $n$,
                   {\sl cmo} $c_1$, {\sl cmo} $c_2$, $\cdots$, {\sl cmo} $c_n$)
   \end{quote}
   %\[  \overbrace{
   %       \begin{tabular}{|c|c|c|c|} \hline
   %       $c_1$ & $c_2$ & $\cdots$ & $c_n$        \\ \hline
   %       \end{tabular}
   %   }^{C}       \]
   %%$n$ は OX\_COMMAND 以外の受け取れるメッセージのタグの種類の数に等しい。
   %%要素数は 1 でももちろん構わない。
   各 $c_i$ もまた以下のようなリスト構造となっており、
   どの $c_i$ も最初の要素が 32 ビットの整数となっている。
   \[  \overbrace{
           \begin{tabular}{|c|c|c|c|c|} \hline
           $c_{i1}$ (32 ビットの整数) & $c_{i2}$ & $c_{i3}$ &
                   $\cdots$ & $c_{im}$     \\ \hline
           \end{tabular}
      }^{c_i}      \]
   このリストの最初の整数値は受け取れるメッセージのタグが入っている。
   $c_{i2}$ 以降については最初の $c_{i1}$ の値によってそれぞれ異なる。
   ここでは、最初の要素が OX\_DATA の場合についてのみ説明する。
   この $c_{i1}$ が OX\_DATA の場合、
   リスト $c_i$ は CMO 形式についての情報を表しており、
   $m=2$ と決められている。
   $c_{i1}$ にはもちろんのこと OX\_DATA が入っており、
   $c_{i2}$ は以下の図のようなリスト構造になっている。
   各要素は 32 ビットの整数であり、
   受け取ることが可能な CMO 形式のタグが入る。
   \[  \overbrace{
           \begin{tabular}{|c|c|c|c|c|} \hline
           $c_{i21}$ & $c_{i22}$ & $\cdots$ & $c_{i2l}$    \\ \hline
           \end{tabular}
      }^{c_{i2}}   \]
   
   %なお、 mathcap データの中では CMO 形式で定義されている
   %32 bit 整数、文字列、リスト構造が使われており、
   %mathcap データに含まれている内容を理解できるためには
   %必然的にこれらも理解できる必要がある
   %(ってことは CMO 形式のところでこれらを
   %説明しなければならないってことです)。
   
   具体的な mathcap の例をあげよう。
 %なお、 $a_1$, $a_2$, $\cdots$, $a_n$ を要素に  %なお、 $a_1$, $a_2$, $\cdots$, $a_n$ を要素に
 %持つリスト構造を {\tt [$a_1$, $a_2$, $\cdots$, $a_n$]} 、  %持つリスト構造を {\tt [$a_1$, $a_2$, $\cdots$, $a_n$]} 、
 %文字列 ``string'' を {\tt "string"} 、 32 bit 整数を  %文字列 ``string'' を {\tt "string"} 、 32 bit 整数を
 %それに対応する 10 進数の整数で示す。  %それに対応する 10 進数の整数で示す。
   名前が ``ox\_test''、バージョンナンバーが 199911250 のサーバであれば、
   $A$ の部分は
   \begin{tabular}{|c|c|} \hline
   199911250 & "ox\_test" \\ \hline
   \end{tabular}
   となる。
   さらに、このサーバのスタックマシンが
   命令コード 2, 3, 5, 7, 11 番を利用可能
   (実際にはこのような命令コードは存在しない)であれば、 $B$ の部分は
   \begin{tabular}{|c|c|c|c|c|} \hline
   2 & 3 & 5 & 7 & 11 \\ \hline
   \end{tabular}
   となり、
   CMO 形式の 32 ビット整数、文字列、 mathcap 、リスト構造のみが
   受け取れるときには、 $C$ の部分は
   \begin{tabular}{|c|} \hline
           \\[-5mm]
           \begin{tabular}{|c|c|} \hline
                   & \\[-5mm]
                   OX\_DATA &
                   \begin{tabular}{|c|c|c|c|} \hline
                   CMO\_INT32 & CMO\_STRING & CMO\_MATHCAP & CMO\_LIST \\ \hline
                   \end{tabular} \\[0.8mm] \hline
           \end{tabular} \\[1.4mm] \hline
   \end{tabular} \\
   となる。
   CMO\_ZZ がないので、このサーバは多倍長整数が送られてこないことを期待して
   いる。
   
 %↓手で作ったので間違えている可能性あり。  なお、データが受け取れることと、データの論理構造が理解できることとはまっ
 %%古いバージョン。差し替えの必要あり。  たく別物であるので注意する必要がある。
 \begin{verbatim}  
 [ [199901160,"ox_asir"],  
   [276,275,258,262,263,266,267,268,274  
     ,269,272,265,264,273,300,270,271],  
   [ [514,[1,2,3,4,5,2130706433,2130706434  
           ,17,19,20,21,22,24,25,26,31,27,33,60]],  
     [2144202544,[0,1]]  
   ]  
 ]  
 \end{verbatim}  
   
 この MathCap データのリスト構造は大きく分けて 3 つの部分に分かれる。  {\Huge ってなんででしょうか? データの論理構造を知らないと受け取れないと
 最初の {\tt [199901160,"ox\_asir"]} の部分にはサーバの情報が入っている。  思うんですが$\ldots$}
 %この最初の要素がまたリスト構造となっており、  
 最初の要素はバージョンナンバーを、次の要素はサーバの名前を表している。  
   
 次の {\tt [276,275,$\cdots$,271]} の部分は  
 サーバに対する動作に対応した理解可能なデータの種類を表している。  
 サーバの動作に対するデータはすべて 32 bit の整数で表しており、  
 このリストは理解可能なデータに対応する 32 bit 整数のリストとなっている。  
   
 最後の {\tt [ [514,[1,2,3,$\cdots$,60]],[2144202544,[0,1]] ]} の部分は  
 理解可能なデータの形式を表している。  
 この部分はさらに {\tt [514,[1,2,3,$\cdots$,60]]} と  
 {\tt [2144202544,[0,1]]} にの部分に分けることができ、  
 それぞれが一つのデータ形式についての情報となっている。  
 どのデータ形式についての情報かは最初の要素にある整数値をみれば  
 分かるようになっている。  
 この整数値は CMO 形式では 514 となっている。  
 最初のデータ形式を区別する整数値以後の要素は  
 各データ形式によってどのように使われるか定まっている。  
 CMO 形式では理解可能なデータのタグがリストの中に収まっている。  
 前節で CMO 形式では多倍長整数を表すタグが 20 であることを述べたが、  
 このリストに 20 が含まれているので、  
 ox\_asir は CMO 形式の多倍長整数を受け取れることがわかる。  
   
 なお、データが受け取れることと、  
 データの論理構造が理解できることとはまったく別物であるので  
 注意する必要がある。  
   
   
 \section{セキュリティ対策}  \section{セキュリティ対策}
   
 OpenXM では幾らかのセキュリティ対策を考えている。  OpenXM 規約は TCP/IP を用いて通信を行うことを考慮している。ネットワーク
 OpenXM に対応したソフトウェアをクラックしても  によって接続される現代の多くのソフトウェアと同様、OpenXM 規約もまた通信
 大した利点はないと思えるが、それは設計上の話であって、  時のセキュリティについて注意している。以下、このことについて説明しよう。
 予期せぬ手段で攻撃を受けた場合にどのような事態を  
 招くかは想像し難い。  
   
 そこで、 OpenXM では侵入者に攻撃の機会を  {\large\bf 意味不明なことを書いているが、}
 できるだけ与えないようにしている。  
 具体的には、接続が必要になった時のみ接続を待つようにし、  
 常に接続に関与するといったことは避けている。  
   
 しかし、これだけでは侵入者が接続を行なう一瞬のすきを  侵入者に攻撃の機会をできるだけ与えないようするた
 狙ってくる可能性もある。  めに、接続が必要になった時のみ接続を待つようにし、
 そこで接続を行なう時に、  常に接続に関与するといったことは避けている(やっぱり意味不明である)。
 接続を待つ port 番号をランダムに決めている。  
 こうすることで、特定の port 番号を狙って接続を行なう  
 瞬間を待つ手口を幾らか防ぐことができる。  
   
   また、侵入者が接続を行なう一瞬のすきを狙ってくる可能性もあるので、
   接続を行なう時に接続を待つポート番号をランダムに決めている(誰が決めてい
   るのかはやっぱり不明であるが)。
 さらにもう一段安全性を高めるために、  さらにもう一段安全性を高めるために、
 接続時に 1 回だけ使用可能なパスワードを作成し、  接続時に 1 回だけ使用可能なパスワードを作成し、
 そのパスワードを使って認証を行なう。  そのパスワードを使って認証を行なう(誰がパスワードを決めて誰が認証を行っ
   ているのかが不明だけど)。
 このパスワードは一旦使用されれば無効にするので、  このパスワードは一旦使用されれば無効にするので、
 もし仮になんらかの手段でパスワードが洩れたとしても安全である。  もし仮になんらかの手段でパスワードが洩れたとしても安全だと考えている。
   
 なお、上記の port 番号とパスワードは安全な手段で送られて  
 いると仮定している。  
 また、同一のコンピュータ上に悪意のあるユーザはいないと仮定している  
 ことに注意しなければならない。  
 なぜなら、現在の実装ではサーバ、およびクライアントの動作している  
 コンピュータ上ではこの port 番号とパスワードがわかってしまうためである。  
   
 なお、接続が確立した後のメッセージの送受信に関しては、  なお、接続が確立した後のメッセージの送受信に関しては、
 特に暗号化などの処置が行なわれているわけではない。  特に暗号化などの処置を行っているわけではない。
 もし必要があれば、通信路の暗号化を行なう機能がある  もし必要があれば、通信路の暗号化を行なう機能がある
 ソフトウェアを使うことを考えている。  ソフトウェア ssh を使うことを考えている。
   
   
 \section{他のプロジェクト}  \section{他のプロジェクト}
   
 他のプロジェクトについて幾つか紹介する。  他のプロジェクトについても触れておこう。
   
 OpenMath プロジェクトは数学的なオブジェクトを  \begin{itemize}
 コンピュータ上で表現する方法を決定している。  \item OpenMath\\
 各ソフトウェア間でオブジェクトを交換する際の  OpenMath プロジェクトは数学的なオブジェクトをコンピュータ上で表現する方
 オブジェクトの変換手順についても述べられている。  法を規定している。各ソフトウェア間でオブジェクトを交換する際のオブジェク
 表現方法は一つだけでなく、 XML 表現や binary 表現などが  トの変換手順につても定められている。表現方法は幾つかの段階で定められて
 用意されている。  いて、XML 表現やバイナリ表現などが用意されている。詳細は
   
 %以下、調べる必要あり。  http://www.openmath.org/omsoc/   A.M.Cohen
 %NetSolve  
   
 %MP  \item NetSolve
   
 %MCP  http://www.cs.utk.edu/netsolve/
   
   \item MP
   
   http://symbolicNet.mcs.kent.edu/SN/areas/protocols/mp.html
   
   \item MCP
   
   http://horse.mcs.kent.edu/~pwang/
   \end{itemize}
   
   
 \section{現在提供されているソフトウェア}  \section{現在提供されているソフトウェア}
   
 現在 OpenXM 規格に対応しているクライアントソフトウェアには  現在 OpenXM 規約に対応しているクライアントにはasir, sm1, Mathematica が
 asir, sm1, Mathematica がある。  ある。これらのクライアントから OpenXM 規約に対応したサーバを呼び出すこと
 これらのクライアントソフトウェアから  ができる。現在 OpenXM 規約に対応しているサーバソフトウェアには、asir,
 OpenXM 規格に対応したサーバを呼び出すことができる。  sm1, gnuplot, Mathematica などがあり、それぞれ ox\_asir, ox\_sm1,
 現在 OpenXM 規約に対応しているサーバソフトウェアには、  ox\_sm1\_gnuplot, ox\_math という名前で提供されている。また、 OpenMath
  asir, sm1, gnuplot, Mathematica などがあり、  規約の XML 表現で表現されたオブジェクトと CMO 形式のオブジェクトを変換す
 それぞれ ox\_asir, ox\_sm1, ox\_math という名前で提供されている。  るソフトウェアが JAVA によって実装されており、OMproxy という名前で提供さ
 また、 OpenMath 規格の XML 表現で表現されたデータと CMO 形式の  れている。
 データを変換するソフトウェアが JAVA によって実装されており、  
 OMproxy という名前で提供されている。  \begin{thebibliography}{99}
   \bibitem{Ohara-Takayama-Noro-1999}
   小原功任, 高山信毅, 野呂正行:
   {Open asir 入門}, 1999, 数式処理, Vol 7, No 2, 2--17. (ISBN4-87243-086-7, SEG 出版, Tokyo).
   \bibitem{OpenXM-1999}
   野呂正行, 高山信毅:
   {Open XM の設計と実装 --- Open message eXchange protocol for Mathematics},
   1999/11/22
   \end{thebibliography}
   
 \end{document}  \end{document}

Legend:
Removed from v.1.30  
changed lines
  Added in v.1.77

FreeBSD-CVSweb <freebsd-cvsweb@FreeBSD.org>