[MUSASHI-users 476] Re: AGM 実行結果に対する疑問点について

Back to archive index

Takashi Washio washi****@ar*****
2005年 1月 26日 (水) 11:56:19 JST


Handa様

AGM開発者の大阪大学の鷲尾と申します。
お問い合わせありがとうございます。

>>疑問点1:サンプルデータの結果について
>  agmを実行した結果がグラフ頂点IDのリストになっていますが、
>  この結果は、説明にあるように、
>  『発ガン性を引き起こす部分分子構造が含まれている可能性が高い』
>  構造なのでしょうか?
>  それとも、あくまでもサンプルなのでしょうか?

サンプルデータは、GMLを示すためのあくまでサンプルです。
発がん性とは関係ありません。

>疑問点2:サンプルデータを編集した結果について1
>  agmを実行した結果を原子のリストにするべく、
>  サンプルデータのVertexLabelの付け替え等の試行しましたが、
>  最終的に、VertexLabelの数をひとつにする事で、
>  頂点IDのリストから(>>)原子のリストになりました。
>  マイニング対象のfieldを指定することは出来ないのでしょうか?

すみません。おっしゃる意味がよくつかめません。
各多頻度グラフ(多頻度な部分グラフ)ごとに、現れた原子の種類
のリストを作成しようとされているのでしょうか??

>疑問点3:サンプルデータを編集した結果について2
>  上記のように頂点のfieldを原子ひとつにして実行した結果、
>  ======
>    <Graph graphId="27" miningStatus="induced" support="0.833">
>      <Vertex vertexId="1" dimension="1">
>        <VertexLabel field="atomy" value="C"/>
>      </Vertex>
>      <Vertex vertexId="2" dimension="1">
>        <VertexLabel field="atomy" value="C"/>
>      </Vertex>
>      <Vertex vertexId="3" dimension="1">
>        <VertexLabel field="atomy" value="Cl"/>
>      </Vertex>
>      <Edge edgeId="1" edgeType="undirected" dimension="1" 
>bgnVertexId="1" endVertexId="2">
>        <EdgeLabel field="bondtype" value="s"/>
>      </Edge>
>      <Edge edgeId="2" edgeType="undirected" dimension="1" 
>bgnVertexId="2" endVertexId="3">
>        <EdgeLabel field="bondtype" value="s"/>
>      </Edge>
>    </Graph>
>  ======
>  
>  このようにすべての頂点が連結している結果とともに、
>  
>  ======
>    <Graph graphId="32" miningStatus="induced" support="0.667">
>      <Vertex vertexId="1" dimension="1">
>        <VertexLabel field="atomy" value="C"/>
>      </Vertex>
>      <Vertex vertexId="2" dimension="1">
>        <VertexLabel field="atomy" value="C"/>
>      </Vertex>
>      <Vertex vertexId="3" dimension="1">
>        <VertexLabel field="atomy" value="C"/>
>      </Vertex>
>      <Vertex vertexId="4" dimension="1">
>        <VertexLabel field="atomy" value="Cl"/>
>      </Vertex>
>      <Edge edgeId="1" edgeType="undirected" dimension="1" 
>bgnVertexId="3" endVertexId="4">
>        <EdgeLabel field="bondtype" value="s"/>
>      </Edge>
>    </Graph>
> ======
> 
> このように一部、または全ての頂点に連結が無いという
> 結果がでてきました。
> 
> このような結果は、
> 『グラフ理論的には正しく、化合物的に正しくない』
> という解釈でよろしいのでしょうか?

後者は図に書くと
C C C−C
という2つの炭素が単合し、他に2個の炭素があるパターン
ですね。たくさんの化合物の中にたとえば
C−*−C−*−C−C
や
C−*−C−C
C−*/
というパタンが沢山あると(*はワイルドカード、いろんな原子)、
これらに共通する部分グラフは*に結びついた2つのCと
右側のC−Cです。これをGMLで書くと
C C C−C
のパターンになります。Cが単独で現れれても決して孤立した
炭素ということではなく、孤立しているか他の不特定の原子と
結合している炭素ということになります。化合物の中に含まれる
部分構造という意味では、化合物的にも正しい構造です。

お分かりいただけたでしょうか。

鷲尾





MUSASHI-users メーリングリストの案内
Back to archive index