This commit is contained in:
Aleksander Mendoza 2021-05-02 14:49:40 +02:00
parent 576f1b492d
commit 7240aa9df5
8 changed files with 3838 additions and 0 deletions

39
jp/Solution.py Normal file
View File

@ -0,0 +1,39 @@
categories = {'アクセサリ', 'ケーブル・アダプター', 'ヘアウォーター・ミスト', 'アドベンチャー', 'アクセサリーキット', 'スマートプラグ', '本体・周辺機器', 'カメラバック・ケース',
'ライトノベル', '強調・色彩効果用フィルター', 'Selfie Sticks', 'ボイスレコーダー', '周辺機器・アクセサリ', 'ホールドリング', 'フェイスプレート', '液晶保護フィルム',
'Film', 'Single-Use Cameras', 'モニタアーム&スタンド', 'Box・デッキ・パック', 'ロボット・子ども向けフィギュア', 'ベビー枕', 'カメラ用交換レンズ',
'タッチペン・スタイラス', 'カメラ用カメラグリップ', 'エクササイズマット', 'SF', 'キッズ・ファミリー', 'オーバーイヤーヘッドホン', '押しボタンスイッチ', 'キッチンタイマー',
'レーダー探知機本体', 'コントローラー', 'Styluses', 'USBアダプタ', 'フィン', 'エコバッグ・買い物バッグ', 'DVD', 'J-POP', '三脚', '楽器別',
'バッグ・財布', '腰枕', 'ベビーモニター', 'スマートトラッカー', 'ウェアラブルカメラ用マウント部品', '外付メモリカードリーダー', 'ホームプロジェクター',
'Earbud Headphones', 'ケース・収納', '輸入盤', 'スキャナ', 'インスタントカメラ', 'タイムカード本体', 'フォトフレーム', 'HDD保管バッグ・ケース', 'ヘアオイル',
'手帳型', 'ソケット分配器', 'フィルター', 'ディスプレイ', 'カーオーディオ', '電池', 'ファンブック', '日本映画', 'フォームローラー', 'ジャングルジム・ブランコ',
'撮影用小道具', 'スクリーンプロテクター', 'イラスト集・オフィシャルブック', 'コミック・アニメ・BL', 'DVDプレーヤー', 'クイックシュー・プレート・ブラケット',
'スカイライト・UVフィルター', 'ドライブレコーダー', '空気清浄機', 'Complete Tripods', 'ハンドヘルドジンバル・スタビライザー', 'サブカルチャー', 'ロック',
'日本のTVドラマ', 'ラベルライター', 'カメラ用液晶保護フィルム', 'タブレット', 'ケーブル', 'オーディオインターフェイス', 'レンズキャップ', 'ペンタブレット', 'ヨガ',
'ローボード・テレビ台', 'ぬいぐるみ', 'タブレット用保護フィルム', '地上デジタルチューナー', 'イヤホン', 'グラフィックボード', '眉用はさみ', 'ドラマ', 'アクセサリ・サプライ',
'ヘアアイロン', '家電', 'フィルム', 'ゲーム', 'メンズ', 'Bluetoothアダプタ', 'ケース・プロテクター', '保護フィルター', 'ワンダースワン', '外付けマイク',
'バリカン・ヘアカッター', 'ツーバーナー', 'アクション', 'シュノーケル・軽器材セット', 'ヘアクリップ・バレッタ', 'レンズ付きフィルム', 'ヨーグルトメーカー', 'シューズ',
'バランスボール', 'ゲーミングヘッドセット', '浮き輪', 'ログブック・アクセサリー小物', 'DVI-HDMIアダプタ', 'カメラ', '交換レンズ', 'USBメモリ・フラッシュドライブ',
'ノートパソコン', 'レイングッズ', 'ブルーレイレコーダー', 'ステージ・人形劇', '外付CD・DVDドライブ', '財布', '防水バッグ', 'エクササイズバンド&チューブ', 'ロボット',
'DAコンバーター', '小皿', '外付ハードディスクドライブ', 'SF・ホラー・ファンタジー', 'Anime', 'レコードプレーヤー', 'ドライブレコーダー本体', 'AVセレクター',
'コントローラー(ハンドル・ジョイスティック)', 'BS・CSチューナー', 'ワイヤレスオーディオレシーバー', 'ブルーレイプレーヤー', '有線LANアダプタ', 'イヤホン・ヘッドホン本体',
'フェイス・眉シェーバー', '知育・教育', 'タッチペン', 'ケース・カバーセット', 'SDカード', 'ブロック', '特撮', 'イヤホン・ヘッドホン', 'マウス', '変換コネクタ',
'ケース', 'メモリーカード', 'ゲーミングマウス', 'プールバッグ', 'ウェアラブルカメラ・アクションカム', 'コミック', 'マイク', 'TVチューナー・キャプチャーボード', 'ゲーム攻略本',
'パズル', 'おむつ', '内張りはがし・クリップクランプツール', 'レンズフード', '外付ブルーレイドライブ', 'アニメ', 'ゲーミングキーボード',
'Security Monitors & Displays', 'バッグ', 'ベース・スタンド', 'ドライブレコーダーアクセサリ', '保護用品', 'フィギュア・コレクタードール', 'マウスパッド',
'ゲームソフト', 'スマートフォン用カメラレンズ', 'アルバム', 'カメラ・双眼鏡用ストラップ・ホルダー', '変換アダプター・変換プラグ', 'シェーカーボトル', '変換アダプタ',
'ビデオカメラサポート', 'ゲーム用ヘッドセット', 'プレイステーションネットワーク', 'Nintendo Switch', 'ネックレス', 'シュノーケル単体', 'microSDカード',
'自撮り棒', 'ゲーム機本体', '卓上三脚・ミニ三脚', '', 'プレイステーション4', '一脚', '雑誌', 'ミニカー・ダイキャストカー', 'Home Security Systems',
'アメリカのTVドラマ', 'ファンタジー', 'アニメ・ゲーム', 'お絵かき', '電源タップ', 'ウエイト・ベルト', 'タブレットケース', 'キッズアニメ・テレビ', 'リモコン・コントローラ',
'ソフトボックス'}
def find_cat(line):
for cat in categories:
if cat in line:
return cat
return cat
with open('test-A/in.tsv') as f:
for entry in f:
print('category='+find_cat(entry))

1
jp/config.txt Normal file
View File

@ -0,0 +1 @@
--metric MultiLabel-F1 --precision 5 -B 200 --in-header in-header.tsv

1899
jp/dev-0/expected.tsv Normal file

File diff suppressed because it is too large Load Diff

BIN
jp/dev-0/in.tsv.xz Normal file

Binary file not shown.

1
jp/in-header.tsv Normal file
View File

@ -0,0 +1 @@
category product
1 category product

1898
jp/test-A/expected.tsv Normal file

File diff suppressed because it is too large Load Diff

BIN
jp/test-A/in.tsv.xz Normal file

Binary file not shown.

BIN
jp/train/train.tsv.xz Normal file

Binary file not shown.