# bytecup

**Repository Path**: wdfnst/bytecup

## Basic Information

- **Project Name**: bytecup
- **Description**: No description available
- **Primary Language**: Python
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 1
- **Forks**: 1
- **Created**: 2016-11-11
- **Last Updated**: 2020-12-19

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# 配置说明:
1. 已经将svd_feature, he svd_feature_infer运行的参数从配置文件 binaryClassification.conf 全部转移至使用svd_feature和svd_feature_infer的参数进行传递, 这样可以方便在遍历参数的时候直接生成参数字符串而不用先生成参数的配置文件, 而给出的参数配置文件binaryClassification_null.conf是为了参数占位(svd_feature的程序中需要使用参数的配置文件名作为它运行时的task名字).
2. 采用了10中不同的文件切分(训练数据和验证数据的比例~9/1)，每组参数都需要在这十个切分上运行，最后求均值(和方差).
3. 每组参数在一个数据切分中运行之后，产生的预测数据以特殊的文件名存储，格式为:
         ```
         pred-lr-wd_item-wd_user-number_factor-active_type
         ```

# 运行说明:
1. Step-A. 首先在svdfeature-1.2.2/目录下编译(直接运行make), 再在svdfeature-1.2.2/tools目录内编译（直接make）生成工具tools/make_feature_buffer.
2. Step-B. 直接python fitting.py. 

# fitting.py说明:
1. 程序入口main()函数首先会调用init()函数，在init()函数中会完成对对数据的切分工作。
2. 切分完成之后开始循环参数，并调用dose()函数.
3. 在dose()函数中拼接参数，并完成对svd_feature中相关程序的调用。
4. 最终的误差结果存放在loss_***.txt中，格式为:

    ```
    pred_filename [lossvalue_of_datapartition0, ..., lossvalue_of_datapartition9]


    说明: pred_filename--预测结果
          lossvalue_of_datapartition*--在数据切分*上的损失函数，可能某些数据切分上缺失, 在计算这组参数的平均损失/方差时，使用[***]的平均值/方差。
    ```