该项目包含一个用Python编写的Google App Engine应用程序,执行以下任务:

  1. 将tsv格式的n x m特征矩阵转换为csv格式的文件,其中包含n x m行元组(特征样本) - run_fmx_convert.py

  2. 在Datastore中为此数据构建模型 - model.py

  3. 运行一个仅限地图的MapReduce作业,将您从GCS转换的csv文件导入模型 - pipeline.py。也可以通过bulkload机制导入数据,但速度较慢 - run_upload_data.sh

  4. 特征名称上定义和构建全文搜索索引 - search.py

  5. 提供允许您执行以下操作的用户界面 - main.py:执行上面列出的大部分管理任务,使用全文搜索查找特征