Takashi Washio
washi****@ar*****
2005年 1月 26日 (水) 11:56:19 JST
Handa様 AGM開発者の大阪大学の鷲尾と申します。 お問い合わせありがとうございます。 >>疑問点1:サンプルデータの結果について > agmを実行した結果がグラフ頂点IDのリストになっていますが、 > この結果は、説明にあるように、 > 『発ガン性を引き起こす部分分子構造が含まれている可能性が高い』 > 構造なのでしょうか? > それとも、あくまでもサンプルなのでしょうか? サンプルデータは、GMLを示すためのあくまでサンプルです。 発がん性とは関係ありません。 >疑問点2:サンプルデータを編集した結果について1 > agmを実行した結果を原子のリストにするべく、 > サンプルデータのVertexLabelの付け替え等の試行しましたが、 > 最終的に、VertexLabelの数をひとつにする事で、 > 頂点IDのリストから(>>)原子のリストになりました。 > マイニング対象のfieldを指定することは出来ないのでしょうか? すみません。おっしゃる意味がよくつかめません。 各多頻度グラフ(多頻度な部分グラフ)ごとに、現れた原子の種類 のリストを作成しようとされているのでしょうか?? >疑問点3:サンプルデータを編集した結果について2 > 上記のように頂点のfieldを原子ひとつにして実行した結果、 > ====== > <Graph graphId="27" miningStatus="induced" support="0.833"> > <Vertex vertexId="1" dimension="1"> > <VertexLabel field="atomy" value="C"/> > </Vertex> > <Vertex vertexId="2" dimension="1"> > <VertexLabel field="atomy" value="C"/> > </Vertex> > <Vertex vertexId="3" dimension="1"> > <VertexLabel field="atomy" value="Cl"/> > </Vertex> > <Edge edgeId="1" edgeType="undirected" dimension="1" >bgnVertexId="1" endVertexId="2"> > <EdgeLabel field="bondtype" value="s"/> > </Edge> > <Edge edgeId="2" edgeType="undirected" dimension="1" >bgnVertexId="2" endVertexId="3"> > <EdgeLabel field="bondtype" value="s"/> > </Edge> > </Graph> > ====== > > このようにすべての頂点が連結している結果とともに、 > > ====== > <Graph graphId="32" miningStatus="induced" support="0.667"> > <Vertex vertexId="1" dimension="1"> > <VertexLabel field="atomy" value="C"/> > </Vertex> > <Vertex vertexId="2" dimension="1"> > <VertexLabel field="atomy" value="C"/> > </Vertex> > <Vertex vertexId="3" dimension="1"> > <VertexLabel field="atomy" value="C"/> > </Vertex> > <Vertex vertexId="4" dimension="1"> > <VertexLabel field="atomy" value="Cl"/> > </Vertex> > <Edge edgeId="1" edgeType="undirected" dimension="1" >bgnVertexId="3" endVertexId="4"> > <EdgeLabel field="bondtype" value="s"/> > </Edge> > </Graph> > ====== > > このように一部、または全ての頂点に連結が無いという > 結果がでてきました。 > > このような結果は、 > 『グラフ理論的には正しく、化合物的に正しくない』 > という解釈でよろしいのでしょうか? 後者は図に書くと C C C−C という2つの炭素が単合し、他に2個の炭素があるパターン ですね。たくさんの化合物の中にたとえば C−*−C−*−C−C や C−*−C−C C−*/ というパタンが沢山あると(*はワイルドカード、いろんな原子)、 これらに共通する部分グラフは*に結びついた2つのCと 右側のC−Cです。これをGMLで書くと C C C−C のパターンになります。Cが単独で現れれても決して孤立した 炭素ということではなく、孤立しているか他の不特定の原子と 結合している炭素ということになります。化合物の中に含まれる 部分構造という意味では、化合物的にも正しい構造です。 お分かりいただけたでしょうか。 鷲尾