# sohu2021-baseline-main **Repository Path**: Tian__wei/sohu2021-baseline-main ## Basic Information - **Project Name**: sohu2021-baseline-main - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2021-04-05 - **Last Updated**: 2021-04-05 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 欢迎参加SOHU2021文本匹配算法大赛! [报名网站](https://www.sohu.com/) | [比赛论坛](https://www.sohu.com/) | [了解搜狐](https://www.sohu.com/) ## 比赛Baseline 本项目是sohu2021-文本匹配算法大赛的baseline,基于bm25和多层感知机(MLP)分类器完成 #### 环境搭建 ```bash pip install -r requirements.txt ``` #### 快速上手 ```bash python train_and_evaluate.py --input_file data/raw/samples.txt ``` #### 数据格式 ```json { "source": "日媒:国际奥委会考虑将参加东京奥运会开幕式运动员减半", "target": "东京奥运会开幕式或将缩小规模", "labelA": "1" } ``` ## 引用 ## Licence ## Reference https://www.sohu.com/