该项目包含一个用Python编写的Google App Engine应用程序,执行以下任务:
-
将tsv格式的n x m特征矩阵转换为csv格式的文件,其中包含n x m行元组(特征、样本、值) - run_fmx_convert.py
-
在Datastore中为此数据构建模型 - model.py
-
运行一个仅限地图的MapReduce作业,将您从GCS转换的csv文件导入模型 - pipeline.py。也可以通过bulkload机制导入数据,但速度较慢 - run_upload_data.sh。
-
在特征名称上定义和构建全文搜索索引 - search.py。
-
提供允许您执行以下操作的用户界面 - main.py:执行上面列出的大部分管理任务,使用全文搜索查找特征。
暂无评论