グローバルせどらーの「データ収集ツール」は、Amazonのカテゴリーを選定し、そのカテゴリーに属するASINを上から順に機械的に抽出する仕組みになっています。よって、Amazonのカテゴリーの構造が把握できていないと、同じ商品(ASIN)が属する複数のカテゴリーを抽出対象としてしまい、結果、既に抽出済みのASIN情報を何度も取得し続けるような事態が起きてしまいます。そこで、まずはここでAmazonのカテゴリーの構図を確認しましょう。

商品種類の「縦軸」と商品条件の「横軸」

これまでAmazonを利用された経験がおあいになるかと思いますが、その際にカテゴリーを確認したことがありますか?Amazonのカテゴリーは、商品の「種類ごと」に分かれていますが、それとは別に商品の条件毎にもカテゴリーが設定されています。

具体例を挙げましょう。日本のAmazonでテレビゲームカテゴリーの中を確認してみると、以下の画像のように「プレイステーション4」「プレイステーション3」など商品種類ごとのカテゴリー、すなわち「縦軸」にあたるカテゴリーが表示されます。一般的によく知られているのはこの「縦軸」カテゴリーになります。

0822

続きて、この縦軸カテゴリーの中の「プレイステーション4」をクリックしてみましょう。すると以下のような画面が表示されます。

FireShot-Capture-105---Amazon.co.jp_-プレイステーション_---https___www.amazon.co.jp_b_ref=amb_link_92912169_7

このように「絞り込み」という項目名の下に「新着」「エディション」「発送オプション」など、それぞれの商品が該当する条件毎に商品がカテゴリー分けされているのがご確認いただけるかと思います。この条件化に分けられるカテゴリーを「横軸カテゴリー」と呼ぶことにします。

組み合わせNG1.「縦カテ」×「横カテ」

大カテゴリーの中の中・小カテゴリーから、抽出対象となるカテゴリーをいくつか選択するのですが、そのとき組み合わせを間違えるとASINの重複が発生してしまいます。よっていくつかNGの組み合わせパターンをご紹介して8行きます。

まず、典型的なNGの組み合わせになるのが、この「縦カテ」×「横カテ」です。想像していただければお分かりいただけるかと思いますが、大カテゴリー「テレビゲームカテゴリー」内の「プレイステーション4(縦)」と「カスタマーレビュー4以上(横)」を抽出対象にしたとしましょう。そうすると、「プレイステーション4」かつ「カスタマーレビュー4以上(横)」の商品がこの両方のカテゴリーに属することになるので、この条件の商品はみな、2回抽出対象となることになってしまいます。評価が4以上のプレイステーション4ソフトは多いので、かなり多くの商品が2回抽出されてしまいそうです。

組み合わせNG2.「横カテ」×「横カテ」(場合による)

次に「横カテ」×「横カテ」も気を付けなければなりません。例えば、「カスタマーレビュー4以上(横)」と「1500円以内」の「キッチン用品」などは、かなりの数の商品が重複してしまっていることが想定されます。

このように、条件で分けられる横カテゴリーは選択する場合にかなりの注意が求められます。では、反対に推奨される例を挙げましょう。

組み合わせOK1.「縦カテ」×「縦カテ」

一つ目にあげられるのが商品種毎に分けられる「縦カテゴリー」を複数対象とする選定法です。例えば「PS3」と「PS4」を選択し、情報抽出した場合、この2つに該当するASINはほとんど存在しないことが想定されます。

組み合わせOK2.「横カテ」×「横カテ」

先ほどNGとして挙げさせていただいた「横カテ」×「横カテ」ですが、場合によってはASINの重複がなされない場合があります。例えば、「価格帯1500円以下」と「1500円以上5000以下」の商品など、同種かつ異条件の場合においては、商品が同じカテゴリーに属することがありません。

このように、抽出時に分け方を工夫することで、ASINの重複が回避され、情報抽出の時間を大幅短縮することが可能となります。特に「横カテ」をうまく組み合わせると、ASIN抽出時に、同時に仕入対象外の商品を排除することも可能となります。この対象カテゴリーの選定はこのツールを使う上での要になります。なので、実施前にきちんと念頭においておくとよいでしょう。

この記事が気に入ったら
いいね!しよう