[MUSASHI-users 452] Re: アクセスログの複数条件による集計

Back to archive index

Sumio Ebisawa ebisa****@aa*****
2004年 12月 28日 (火) 01:38:32 JST


海老澤です。お世話になります。


中原様、石倉様、返信ありがとうございます。ご連絡が遅くなってしまい、
申し訳ございません。

> ページビューについてもう少し詳しくお聞かせ下さい。
>
> > ファイルは「会員ID URL 時間
> > 参照元」という形にならんでいます。
> >
> > 001 /a.html 2月1日 www.yahoo.co.jp
> > 001 /b.html 2月1日 www.yahoo.co.jp
> > 001 /a.html 2月1日 www.yahoo.co.jp
> > 002 /a.html 2月1日 www.yahoo.co.jp
> > 003 /a.html 2月1日 www.yahoo.co.jp
>
> この場合のページビューとは、ID001の場合ですとURLのトータ
> ルな数3になるのでしょうか、それとも顧客ごとにURLをユニ
> ークした数、001の場合ですと2になるのでしょうか?

説明不足で申し訳ございません。会員ID別のページビュー数では
なく、各URL別のページビュー数とユニークユーザを求めたい次第
です。上記の場合には、次のようになります。

 URL   PV UU
 /a.html  4  3
 /b.html  1  1

 PV - ページビュー数
 UU - ユニークユーザ数

/a.htmlが見られた回数(ページビュー数)は4回、見た人の数
(ユニークユーザ数)はIDが001,002,003の3人、となります。
仮にID001の人が100回/a.htmlを閲覧しても、ユニークユーザ数
は1と数えたい訳です。

> 確認ですが、海老澤様はすべてのURLについて、URLごとにペー
> ジビューの合計数とユニークなID数を求めたいという事でよろ
> しいのでしょうか?

その通りです。

> 下記に一発でできるスクリプトを書いてみました。
> もっとシンプルにすることはできると思いますが、ご参考までに。

石倉様、わざわざスクリプトまでまとめていただいて恐縮です。
私の説明不足のため、このままではURL別ではなく全体のページ
ビュー数とユニークユーザがカウントされてしまいますが、方向性
を教えていただいたため、私なりにロジックをまとめてみました。

 1 ID付きレコードのURL別ページビュー数を一時ファイルに出力
 2 ID付きレコードのURL別ユニークユーザ数を一時ファイルに出力
 3 ID無しレコードのURL別ページビュー数を一時ファイルに出力
 4 1〜3を、URLをキーにまとめる
 5 4の3つの項目を利用して、ユニークユーザ数(推計)を求める

これをシェルスクリプトでまとめるといいと思いますが、いかがで
しょうか?(できれば一時ファイルなしで処理したいですが、無理
ですよね?)










MUSASHI-users メーリングリストの案内
Back to archive index