init

2020-06-27 14:19:43 +08:00 · 2020-06-27 14:19:43 +08:00 · 5b1151035c
commit 5b1151035c
23 changed files with 2865 additions and 0 deletions
--- a/.gitignore
+++ b/.gitignore
@ -0,0 +1,4 @@
+node_modules/
+gdurl.sqlite
+config.js
+sa/*.json
--- a/check.js
+++ b/check.js
@ -0,0 +1,3 @@
+const { ls_folder } = require('./src/gd')
+
+ls_folder({ fid: 'root' }).then(console.log).catch(console.error)
--- a/compare.md
+++ b/compare.md
@ -0,0 +1,63 @@
+# 对比本工具和其他类似工具在 server side copy 的速度上的差异
+
+以拷贝[https://drive.google.com/drive/folders/1W9gf3ReGUboJUah-7XDg5jKXKl5XwQQ3](https://drive.google.com/drive/folders/1W9gf3ReGUboJUah-7XDg5jKXKl5XwQQ3)为例（[文件统计](https://gdurl.viegg.com/api/gdrive/count?fid=1W9gf3ReGUboJUah-7XDg5jKXKl5XwQQ3)）  
+共 242 个文件和 26 个文件夹
+
+如无特殊说明，以下运行环境都是在本地命令行（挂代理）
+
+## 本工具耗时 40 秒
+<!-- ![](https://viegg.oss-cn-shenzhen.aliyuncs.com/1592732262296.png)   -->
+![](static/gdurl.png)
+
+另外我在一台洛杉矶的vps上执行相同的命令，耗时23秒。
+这个速度是在使用本项目默认配置**20个并行请求**得出来的，此值可自行修改（下文有方法），并行请求数越大，总速度越快。
+
+## AutoRclone 耗时 4 分 57 秒（去掉拷贝后验证时间 4 分 6 秒）
+<!-- ![](https://viegg.oss-cn-shenzhen.aliyuncs.com/1592732547295.png) -->
+![](static/autorclone.png)
+
+## gclone 耗时 3 分 7 秒
+<!-- ![](https://viegg.oss-cn-shenzhen.aliyuncs.com/1592732597593.png) -->
+![](static/gclone.png)
+
+## 为什么速度会有这么大差异
+首先要明确一下 server side copy（后称ssc） 的原理。
+
+对于 Google Drive 本身而言，它不会因为你ssc复制了一份文件而真的去在自己的文件系统上复制一遍（否则不管它有多大硬盘都会被填满），它只是在数据库里添上了一笔记录。
+
+所以，无论ssc一份大文件还是小文件，理论上它的耗时都是一样的。
+各位在使用这些工具的时候也可以感受到，复制一堆小文件比复制几个大文件要慢得多。
+
+Google Drive 官方的 API 只提供了复制单个文件的功能，无法直接复制整个文件夹。甚至也无法读取整个文件夹，只能读取某个文件夹的第一层子文件（夹）信息，类似 Linux 命令行里的 `ls` 命令。
+
+这三个工具的ssc功能，本质上都是对[官方file copy api](https://developers.google.com/drive/api/v3/reference/files/copy)的调用。
+
+然后说一下本工具的原理，其大概步骤如下：
+
+- 首先，它会递归读取要复制的目录里的所有文件和文件夹的信息，并保存到本地。
+- 然后，将所有文件夹对象过滤出来，再根据彼此的父子关系，创建新的同名文件夹，还原出原始结构。（在保证速度的同时保持原始文件夹结构不变，这真的费了一番功夫）
+- 根据上一步创建文件夹时留下的新旧文件夹ID的对应关系，调用官方API复制文件。
+
+得益于本地数据库的存在，它可以在任务中断后从断点继续执行。比如用户按下`ctrl+c`后，可以再执行一遍相同的拷贝命令，本工具会给出三个选项：
+<!-- ![](https://viegg.oss-cn-shenzhen.aliyuncs.com/1592735608511.png) -->
+![](static/choose.png)
+
+另外两个工具也支持断点续传，它们是怎样做到的呢？AutoRclone是用python对rclone命令的一层封装，gclone是基于rclone的魔改。
+对了——值得一提的是——本工具是直接调用的官方API，不依赖于rclone。
+
+我没有仔细阅读过rclone的源码，但是从它的执行日志中可以大概猜出其工作原理。
+先补充个背景知识：对于存在于Google drive的所有文件（夹）对象，它们的一生都伴随着一个独一无二的ID，就算一个文件是另一个的拷贝，它们的ID也不一样。
+
+所以rclone是怎么知道哪些文件拷贝过，哪些没有呢？如果它没有像我一样将记录保存在本地数据库的话，那么它只能在同一路径下搜索是否存在同名文件，如果存在，再比对它们的 大小/修改时间/md5值 等判断是否拷贝过。
+
+也就是说，在最坏的情况下（假设它没做缓存），它每拷贝一个文件之前，都要先调用官方API来搜索判断此文件是否已存在！
+
+此外，AutoRclone和gclone虽然都支持自动切换service account，但是它们执行拷贝任务的时候都是单一SA在调用API，这就注定了它们不能把请求频率调太高——否则可能触发限制。
+
+而本工具同样支持自动切换service account，区别在于它的每次请求都是随机选一个SA，我的[文件统计](https://gdurl.viegg.com/api/gdrive/count?fid=1W9gf3ReGUboJUah-7XDg5jKXKl5XwQQ3)接口就用了20个SA的token，同时请求数设置成20个，也就是平均而言，单个SA的并发请求数只有一次。
+
+所以瓶颈不在于SA的频率限制，而在运行的vps或代理上，各位可以根据各自的情况适当调整 PARALLEL_LIMIT 的值（在 `config.js` 里）。
+
+当然，如果某个SA的单日流量超过了750G，会自动切换成别的SA，同时过滤掉流量用尽的SA。当所有SA流量用完后，会切换到个人的access token，直到流量同样用尽，最终进程退出。
+
+*使用SA存在的限制：除了每日流量限制外，其实每个SA还有个**15G的个人盘空间限额**，也就是说你每个SA最多能拷贝15G的文件到个人盘，但是拷贝到团队盘则无此限制。*
--- a/config.js
+++ b/config.js
@ -0,0 +1,24 @@
+// 单次请求多少毫秒未响应以后超时（基准值，若连续超时则下次调整为上次的2倍）
+const TIMEOUT_BASE = 7000
+// 最大超时设置，比如某次请求，第一次7s超时，第二次14s，第三次28s，第四次56s，第五次不是112s而是60s，后续同理
+const TIMEOUT_MAX = 60000
+
+const LOG_DELAY = 5000 // 日志输出时间间隔，单位毫秒
+const PAGE_SIZE = 1000 // 每次网络请求读取目录下的文件数，数值越大，越有可能超时，不得超过1000
+
+const RETRY_LIMIT = 7 // 如果某次请求失败，允许其重试的最大次数
+const PARALLEL_LIMIT = 20 // 网络请求的并行数量，可根据网络环境调整
+
+const DEFAULT_TARGET = '' // 必填，拷贝默认目的地ID，如果不指定target，则会复制到此处，建议填写团队盘ID
+
+const AUTH = { // 如果您拥有service account的json授权文件，可将其拷贝至 sa 目录中以代替 client_id/secret/refrest_token
+  client_id: 'your_client_id',
+  client_secret: 'your_client_secret',
+  refresh_token: 'your_refrest_token',
+  expires: 0, // 可以留空
+  access_token: '', // 可以留空
+  tg_token: 'bot_token', // 你的 telegram robot 的 token，获取方法参见 https://core.telegram.org/bots#6-botfather
+  tg_whitelist: ['your_tg_username'] // 你的tg username(t.me/username)，bot只会执行这个列表里的用户所发送的指令
+}
+
+module.exports = { AUTH, PARALLEL_LIMIT, RETRY_LIMIT, TIMEOUT_BASE, TIMEOUT_MAX, LOG_DELAY, PAGE_SIZE, DEFAULT_TARGET }
--- a/49
+++ b/49
@ -0,0 +1,49 @@
+#!/usr/bin/env node
+
+const bytes = require('bytes')
+
+const { argv } = require('yargs')
+  .usage('用法: ./$0 <source id> <target id> [options]\ntarget id可选，不填则使用config.js里的DEFAULT_TARGET')
+  .alias('u', 'update')
+  .describe('u', '不使用本地缓存，强制从线上获取源文件夹信息')
+  .alias('f', 'file')
+  .describe('f', '复制单个文件')
+  .alias('n', 'name')
+  .describe('n', '给目标文件夹重命名，不填则保留原始目录名')
+  .alias('N', 'not_teamdrive')
+  .describe('N', '如果不是团队盘链接，可以加上此参数以提高接口查询效率，降低延迟')
+  .alias('s', 'size')
+  .describe('s', '不填默认拷贝全部文件，如果设置了这个值，则过滤掉小于这个size的文件，必须以b结尾，比如10mb')
+  .alias('S', 'service_account')
+  .describe('S', '指定使用service account进行操作，前提是必须在 ./sa 目录下放置json授权文件，请确保sa帐号拥有操作权限。')
+  .help('h')
+  .alias('h', 'help')
+
+const { copy, copy_file, validate_fid } = require('./src/gd')
+const { DEFAULT_TARGET } = require('./config')
+
+let [source, target] = argv._
+
+if (validate_fid(source)) {
+  const { name, update, file, not_teamdrive, size, service_account } = argv
+  if (file) {
+    target = target || DEFAULT_TARGET
+    if (!validate_fid(target)) throw new Error('target id 格式不正确')
+    return copy_file(source, target).then(r => {
+      const link = 'https://drive.google.com/drive/folders/' + target
+      console.log('任务完成，文件所在位置：\n', link)
+    }).catch(console.error)
+  }
+  let min_size
+  if (size) {
+    console.log(`不复制大小低于 ${size} 的文件`)
+    min_size = bytes.parse(size)
+  }
+  copy({ source, target, name, min_size, update, not_teamdrive, service_account }).then(folder => {
+    if (!folder) return
+    const link = 'https://drive.google.com/drive/folders/' + folder.id
+    console.log('任务完成，新文件夹链接：\n', link)
+  })
+} else {
+  console.warn('目录ID缺失或格式错误')
+}
--- a/31
+++ b/31
@ -0,0 +1,31 @@
+#!/usr/bin/env node
+
+const { argv } = require('yargs')
+  .usage('用法: ./$0 <目录ID> [options]')
+  .example('./$0 1ULY8ISgWSOVc0UrzejykVgXfVL_I4r75', '获取 https://drive.google.com/drive/folders/1ULY8ISgWSOVc0UrzejykVgXfVL_I4r75 内包含的的所有文件的统计信息')
+  .example('./$0 root -s size -t html -o out.html', '获取个人盘根目录统计信息，结果以HTML表格输出，根据总大小逆序排列，保存到本目录下的out.html文件中（不存在则新建，存在则覆盖）')
+  .example('./$0 root -s name -t json -o out.json', '获取个人盘根目录统计信息，结果以JSON格式输出，根据文件扩展名排序，保存到本目录下的out.json文件中')
+  .example('./$0 root -t all -o all.json', '获取个人盘根目录统计信息，将所有文件信息（包括文件夹）以JSON格式输出，保存到本目录下的all.json文件中')
+  .alias('u', 'update')
+  .describe('u', '强制从线上获取信息(无视是否存在本地缓存)')
+  .alias('N', 'not_teamdrive')
+  .describe('N', '如果不是团队盘链接，可以加上此参数以提高接口查询效率，降低延迟。如果要统计的是个人盘且./sa目录下的service account没有相关权限，请确保加上此参数以使用个人的auth信息进行查询')
+  .alias('S', 'service_account')
+  .describe('S', '指定使用service account进行统计，前提是必须在sa目录下放置SA json文件')
+  .alias('s', 'sort')
+  .describe('s', '统计结果排序方法，可选值 name 或 size，不填则默认根据文件数量逆序排列')
+  .alias('t', 'type')
+  .describe('t', '统计结果输出类型，可选值 html/json/all，all表示输出所有文件json数据，最好搭配 -o 使用。不填则默认输出命令行表格')
+  .alias('o', 'output')
+  .describe('o', '统计结果输出文件，适合搭配 -t 使用')
+  .help('h')
+  .alias('h', 'help')
+
+const { count, validate_fid } = require('./src/gd')
+const [fid] = argv._
+if (validate_fid(fid)) {
+  const { update, sort, type, output, not_teamdrive, service_account } = argv
+  count({ fid, update, sort, type, output, not_teamdrive, service_account }).catch(console.error)
+} else {
+  console.warn('目录ID缺失或格式错误')
+}
--- a/create-table.sql
+++ b/create-table.sql
@ -0,0 +1,29 @@
+CREATE TABLE "gd" (
+  "id"  INTEGER NOT NULL PRIMARY KEY AUTOINCREMENT UNIQUE,
+  "fid" TEXT NOT NULL UNIQUE,
+  "info"  TEXT,
+  "summary" TEXT,
+  "subf"  TEXT,
+  "ctime" INTEGER,
+  "mtime" INTEGER
+);
+
+CREATE UNIQUE INDEX "gd_fid" ON "gd" (
+  "fid"
+);
+
+CREATE TABLE "task" (
+  "id"  INTEGER NOT NULL PRIMARY KEY AUTOINCREMENT UNIQUE,
+  "source"  TEXT NOT NULL,
+  "target"  TEXT NOT NULL,
+  "status" TEXT,
+  "copied"  TEXT DEFAULT '',
+  "mapping" TEXT DEFAULT '',
+  "ctime" INTEGER,
+  "ftime" INTEGER
+);
+
+CREATE UNIQUE INDEX "task_source_target" ON "task" (
+  "source",
+  "target"
+);
--- a/db.js
+++ b/db.js
@ -0,0 +1,5 @@
+const path = require('path')
+const db_location = path.join(__dirname, 'gdurl.sqlite')
+const db = require('better-sqlite3')(db_location)
+
+module.exports = { db }
--- a/24
+++ b/24
@ -0,0 +1,24 @@
+#!/usr/bin/env node
+
+const { argv } = require('yargs')
+  .usage('用法: ./$0 <source id> <target id> [options]')
+  .alias('u', 'update')
+  .describe('u', '不使用本地缓存，强制从线上获取源文件夹信息')
+  .alias('S', 'service_account')
+  .describe('S', '使用service account进行操作，前提是必须在 ./sa 目录下放置sa授权json文件')
+  .help('h')
+  .alias('h', 'help')
+
+const { dedupe, validate_fid } = require('./src/gd')
+
+const [fid] = argv._
+if (validate_fid(fid)) {
+  const { update, service_account } = argv
+  dedupe({ fid, update, service_account }).then(info => {
+    if (!info) return
+    const { file_count, folder_count } = info
+    console.log('任务完成，共删除文件数：', file_count, '目录数：', folder_count)
+  })
+} else {
+  console.warn('目录ID缺失或格式错误')
+}
--- a/gdurl.sqlite
+++ b/gdurl.sqlite
--- a/package-lock.json
+++ b/package-lock.json
--- a/package.json
+++ b/package.json
@ -0,0 +1,31 @@
+{
+  "name": "gd-utils",
+  "version": "1.0.0",
+  "description": "google drive utils",
+  "main": "src/gd.js",
+  "scripts": {
+    "start": "https_proxy='http://127.0.0.1:1086' nodemon server.js",
+    "test": "echo \"Error: no test specified\" && exit 1"
+  },
+  "keywords": [],
+  "author": "viegg",
+  "license": "ISC",
+  "dependencies": {
+    "@koa/router": "^9.0.1",
+    "@viegg/axios": "^1.0.0",
+    "better-sqlite3": "^7.1.0",
+    "bytes": "^3.1.0",
+    "cli-table3": "^0.6.0",
+    "colors": "^1.4.0",
+    "dayjs": "^1.8.28",
+    "gtoken": "^5.0.1",
+    "html-escaper": "^3.0.0",
+    "https-proxy-agent": "^5.0.0",
+    "koa": "^2.13.0",
+    "koa-bodyparser": "^4.3.0",
+    "p-limit": "^3.0.1",
+    "prompts": "^2.3.2",
+    "signal-exit": "^3.0.3",
+    "yargs": "^15.3.1"
+  }
+}
--- a/readme.md
+++ b/readme.md
@ -0,0 +1,115 @@
+# Google Drive 百宝箱
+
+> 不只是最快的 google drive 拷贝工具 [与其他工具的对比](./compare.md)
+
+## 功能简介
+本工具目前支持以下功能：
+- 统计任意（您拥有相关权限的，下同，不再赘述）目录的文件信息，且支持以各种形式（html, table, json）导出。  
+支持中断恢复，且统计过的目录信息会记录在本地数据库文件中（gdurl.sqlite）
+请在本项目目录下命令行输入 `./count -h` 查看使用帮助
+
+- 拷贝任意目录所有文件到您指定目录，同样支持中断恢复。
+支持根据文件大小过滤，可输入 `./copy -h` 查看使用帮助
+
+- 对任意目录进行去重，删除同一目录下的md5值相同的文件（只保留一个），删除空目录。
+命令行输入 `./dedupe -h` 查看使用帮助
+
+- 在 config.js 里完成相关配置后，可以将本项目部署在（可正常访问谷歌服务的）服务器上，提供 http api 文件统计接口
+
+- 支持 telegram bot，配置完成后，上述功能均可通过 bot 进行操作
+
+## demo
+[https://drive.google.com/drive/folders/124pjM5LggSuwI1n40bcD5tQ13wS0M6wg](https://drive.google.com/drive/folders/124pjM5LggSuwI1n40bcD5tQ13wS0M6wg)
+
+## 环境配置
+本工具需要安装nodejs，客户端安装请访问[https://nodejs.org/zh-cn/download/](https://nodejs.org/zh-cn/download/)，服务器安装可参考[https://github.com/nodesource/distributions/blob/master/README.md#debinstall](https://github.com/nodesource/distributions/blob/master/README.md#debinstall)
+
+如果你的网络环境无法正常访问谷歌服务，需要先在命令行进行一些配置：（如果可以正常访问则跳过此节）
+```
+http_proxy="YOUR_PROXY_URL" && https_proxy=$http_proxy && HTTP_PROXY=$http_proxy && HTTPS_PROXY=$http_proxy
+```
+请把`YOUR_PROXY_URL`替换成你自己的代理地址
+
+## 依赖安装
+- 命令行执行`git clone https://github.com/iwestlin/gdurl && cd gdurl` 克隆并切换到本项目文件夹下
+- 执行 `npm i` 安装依赖，部分依赖可能需要代理环境才能下载，所以需要上一步的配置
+
+如果在安装过程中发生报错，请切换nodejs版本到v12再试。如果报错信息里有`Error: not found: make`之类的消息，说明你的命令行环境缺少make命令，可参考[这里](https://askubuntu.com/questions/192645/make-command-not-found)或直接google搜索`Make Command Not Found`
+
+依赖安装完成后，项目文件夹下会多出个`node_modules`目录，请不要删除它，接下来进行下一步配置。
+
+## Service Account 配置
+强烈建议使用service account（后称SA）, 获取方法请参见 [https://gsuitems.com/index.php/archives/13/](https://gsuitems.com/index.php/archives/13/#%E6%AD%A5%E9%AA%A42%E7%94%9F%E6%88%90serviceaccounts)
+获取到 SA 的 json 文件后，请将其拷贝到 `sa` 目录下
+
+配置好 SA 以后，如果你不需要对个人盘下的文件进行操作，可跳过[个人帐号配置]这节，而且执行命令的时候，记得带上 `-S` 参数告诉程序使用SA授权进行操作。
+
+## 个人帐号配置
+- 命令行执行 `rclone config file` 找到 rclone 的配置文件路径
+- 打开这个配置文件 `rclone.conf`, 找到 `client_id`, `client_secret` 和 `refresh_token` 这三个变量，将其分别填入本项目下的 `config.js` 中，需要注意这三个值必须被成对的英文引号包裹，且引号后以英文逗号结尾，也就是需要符合JavaScript的[对象语法](https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Reference/Operators/Object_initializer)
+
+如果你没有配置过rclone，可以搜索`rclone google drive 教程`完成相关配置。  
+
+如果你的`rclone.conf`里没有`client_id`和`client_secret`，说明你配置rclone的时候默认用了rclone自己的client_id，连rclone自己[都不建议这样做](https://github.com/rclone/rclone/blob/8d55367a6a2f47a1be7e360a872bd7e56f4353df/docs/content/drive.md#making-your-own-client_id)，因为大家共享了它的接口调用限额，在使用高峰期可能会触发限制。
+
+获取自己的clinet_id可以参见这两篇文章：[Cloudbox/wiki/Google-Drive-API-Client-ID-and-Client-Secret](https://github.com/Cloudbox/Cloudbox/wiki/Google-Drive-API-Client-ID-and-Client-Secret) 和 [https://p3terx.com/archives/goindex-google-drive-directory-index.html#toc_2](https://p3terx.com/archives/goindex-google-drive-directory-index.html#toc_2)
+
+获取到client_id和client_secret后，再次执行一遍`rclone config`，创建一个新的remote，**在配置过程中一定要填入你新获取的clinet_id和client_secret**，就能在`rclone.conf`里看到新获取的`refresh_token`了。**注意，不能使用之前的refrest_token**，因为它对应的是rclone自带的client_id
+
+参数配置好以后，在命令行执行 `node check.js`，如果命令返回了你的谷歌硬盘根目录的数据，说明配置成功，可以开始使用本工具了。
+
+## Bot配置
+如果要使用 telegram bot 功能，需要进一步配置。
+
+首先在 [https://core.telegram.org/bots#6-botfather](https://core.telegram.org/bots#6-botfather) 根据指示拿到 bot 的 token，然后填入 config.js 中的 `tg_token` 变量。
+
+接下来需要将代码部署到服务器上。
+将配置好的项目文件夹打包上传到服务器，解压后进入项目目录，执行`npm i pm2 -g`(需要先安装nodejs)
+
+安装好pm2之后，执行 `pm2 start server.js`，代码运行后会在服务器上监听`23333`端口，接下来可通过nginx或其他工具起一个web服务，示例nginx配置：
+```
+server {
+  listen 80;
+  server_name your.server.name;
+
+  location / {
+    proxy_set_header Host $host;
+    proxy_set_header X-Real-IP $remote_addr;
+    proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
+    proxy_pass http://127.0.0.1:23333/;
+  }
+}
+```
+配置好nginx后，可以再套一层cloudflare，具体教程请自行搜索。
+
+最后，在命令行执行（请将[YOUR_WEBSITE]和[YOUR_BOT_TOKEN]分别替换成你自己的网址和bot token）
+```
+curl -F "url=[YOUR_WEBSITE]/api/gdurl/tgbot" 'https://api.telegram.org/bot[YOUR_BOT_TOKEN]/setWebhook'
+```
+这样，就将你的服务器连接上你的 telegram bot 了，试着给bot发送个 `/help`，如果它回复给你使用说明，那就配置成功了。
+
+## 补充说明
+在`config.js`文件里，还有另外的几个参数：
+```
+// 单次请求多少毫秒未响应以后超时（基准值，若连续超时则下次调整为上次的2倍）
+const TIMEOUT_BASE = 7000
+
+// 最大超时设置，比如某次请求，第一次7s超时，第二次14s，第三次28s，第四次56s，第五次不是112s而是60s，后续同理
+const TIMEOUT_MAX = 60000
+
+const LOG_DELAY = 5000 // 日志输出时间间隔，单位毫秒
+const PAGE_SIZE = 1000 // 每次网络请求读取目录下的文件数，数值越大，越有可能超时，不得超过1000
+
+const RETRY_LIMIT = 7 // 如果某次请求失败，允许其重试的最大次数
+const PARALLEL_LIMIT = 20 // 网络请求的并行数量，可根据网络环境调整
+
+const DEFAULT_TARGET = '' // 必填，拷贝默认目的地ID，如果不指定target，则会拷贝到此处，建议填写团队盘ID，注意要用英文引号包裹
+```
+读者可根据各自情况进行调整
+
+## 注意事项
+程序的原理是调用了[google drive官方接口](https://developers.google.com/drive/api/v3/reference/files/list)，递归获取目标文件夹下所有文件及其子文件夹信息，粗略来讲，某个目录下包含多少个文件夹，就至少需要这么多次请求才能统计完成。
+
+目前尚不知道google是否会对接口做频率限制，也不知道会不会影响google账号本身的安全。
+
+**请勿滥用，后果自负**
--- a/sa/.keep
+++ b/sa/.keep
--- a/server.js
+++ b/server.js
@ -0,0 +1,31 @@
+const dayjs = require('dayjs')
+const Koa = require('koa')
+const bodyParser = require('koa-bodyparser')
+
+const router = require('./src/router')
+
+const app = new Koa()
+app.proxy = true
+
+app.use(catcher)
+app.use(bodyParser())
+app.use(router.routes())
+app.use(router.allowedMethods())
+
+app.use(ctx => {
+  ctx.status = 404
+  ctx.body = 'not found'
+})
+
+const PORT = 23333
+app.listen(PORT, '127.0.0.1', console.log('http://127.0.0.1:' + PORT))
+
+async function catcher (ctx, next) {
+  try {
+    return await next()
+  } catch (e) {
+    console.error(e)
+    ctx.status = 500
+    ctx.body = e.message
+  }
+}
--- a/src/gd.js
+++ b/src/gd.js
@ -0,0 +1,676 @@
+const fs = require('fs')
+const path = require('path')
+const dayjs = require('dayjs')
+const prompts = require('prompts')
+const pLimit = require('p-limit')
+const axios = require('@viegg/axios')
+const HttpsProxyAgent = require('https-proxy-agent')
+const { GoogleToken } = require('gtoken')
+const handle_exit = require('signal-exit')
+
+const { AUTH, RETRY_LIMIT, PARALLEL_LIMIT, TIMEOUT_BASE, TIMEOUT_MAX, LOG_DELAY, PAGE_SIZE, DEFAULT_TARGET } = require('../config')
+const { db } = require('../db')
+const { make_table, make_tg_table, make_html, summary } = require('./summary')
+
+const FOLDER_TYPE = 'application/vnd.google-apps.folder'
+const { https_proxy } = process.env
+const axins = axios.create(https_proxy ? { httpsAgent: new HttpsProxyAgent(https_proxy) } : {})
+
+const sa_files = fs.readdirSync(path.join(__dirname, '../sa')).filter(v => v.endsWith('.json'))
+let SA_TOKENS = sa_files.map(filename => {
+  const gtoken = new GoogleToken({
+    keyFile: path.join(__dirname, '../sa', filename),
+    scope: ['https://www.googleapis.com/auth/drive']
+  })
+  return { gtoken, expires: 0 }
+})
+
+handle_exit(() => {
+  // console.log('handle_exit running')
+  const records = db.prepare('select id from task where status=?').all('copying')
+  records.forEach(v => {
+    db.prepare('update task set status=? where id=?').run('interrupt', v.id)
+  })
+  records.length && console.log(records.length, 'task interrupted')
+})
+
+async function gen_count_body ({ fid, type, update, service_account }) {
+  async function update_info () {
+    const info = await walk_and_save({ fid, update, service_account }) // 这一步已经将fid记录存入数据库中了
+    const { summary } = db.prepare('SELECT summary from gd WHERE fid=?').get(fid)
+    return [info, JSON.parse(summary)]
+  }
+
+  function render_smy (smy, type) {
+    if (['html', 'curl', 'tg'].includes(type)) {
+      smy = (typeof smy === 'object') ? smy : JSON.parse(smy)
+      const type_func = {
+        html: make_html,
+        curl: make_table,
+        tg: make_tg_table
+      }
+      return type_func[type](smy)
+    } else { // 默认输出json
+      return (typeof smy === 'string') ? smy : JSON.stringify(smy)
+    }
+  }
+
+  let info, smy
+  const record = db.prepare('SELECT * FROM gd WHERE fid = ?').get(fid)
+  if (!record || update) {
+    [info, smy] = await update_info()
+  }
+  if (type === 'all') {
+    info = info || get_all_by_fid(fid)
+    if (!info) { // 说明上次统计过程中断了
+      [info] = await update_info()
+    }
+    return JSON.stringify(info)
+  }
+  if (smy) return render_smy(smy, type)
+  if (record && record.summary) return render_smy(record.summary, type)
+  info = info || get_all_by_fid(fid)
+  if (info) {
+    smy = summary(info)
+  } else {
+    [info, smy] = await update_info()
+  }
+  return render_smy(smy, type)
+}
+
+async function count ({ fid, update, sort, type, output, not_teamdrive, service_account }) {
+  sort = (sort || '').toLowerCase()
+  type = (type || '').toLowerCase()
+  output = (output || '').toLowerCase()
+  if (!update) {
+    const info = get_all_by_fid(fid)
+    if (info) {
+      console.log('找到本地缓存数据，缓存时间：', dayjs(info.mtime).format('YYYY-MM-DD HH:mm:ss'))
+      const out_str = get_out_str({ info, type, sort })
+      if (output) return fs.writeFileSync(output, out_str)
+      return console.log(out_str)
+    }
+  }
+  const result = await walk_and_save({ fid, not_teamdrive, update, service_account })
+  const out_str = get_out_str({ info: result, type, sort })
+  if (output) {
+    fs.writeFileSync(output, out_str)
+  } else {
+    console.log(out_str)
+  }
+}
+
+function get_out_str ({ info, type, sort }) {
+  const smy = summary(info, sort)
+  let out_str
+  if (type === 'html') {
+    out_str = make_html(smy)
+  } else if (type === 'json') {
+    out_str = JSON.stringify(smy)
+  } else if (type === 'all') {
+    out_str = JSON.stringify(info)
+  } else {
+    out_str = make_table(smy)
+  }
+  return out_str
+}
+
+function get_all_by_fid (fid) {
+  const record = db.prepare('SELECT * FROM gd WHERE fid = ?').get(fid)
+  if (!record) return null
+  const { info, subf } = record
+  let result = JSON.parse(info)
+  result = result.map(v => {
+    v.parent = fid
+    return v
+  })
+  if (!subf) return result
+  return recur(result, JSON.parse(subf))
+
+  function recur (result, subf) {
+    if (!subf.length) return result
+    const arr = subf.map(v => {
+      const row = db.prepare('SELECT * FROM gd WHERE fid = ?').get(v)
+      if (!row) return null // 如果没找到对应的fid记录，说明上次中断了进程或目录读取未完成
+      let info = JSON.parse(row.info)
+      info = info.map(vv => {
+        vv.parent = v
+        return vv
+      })
+      return { info, subf: JSON.parse(row.subf) }
+    })
+    if (arr.some(v => v === null)) return null
+    const sub_subf = [].concat(...arr.map(v => v.subf).filter(v => v))
+    result = result.concat(...arr.map(v => v.info))
+    return recur(result, sub_subf)
+  }
+}
+
+async function walk_and_save ({ fid, not_teamdrive, update, service_account }) {
+  const result = []
+  const not_finished = []
+  const limit = pLimit(PARALLEL_LIMIT)
+
+  const loop = setInterval(() => {
+    console.log('================')
+    console.log('已获取的对象数量', result.length)
+    console.log('正在进行的网络请求', limit.activeCount)
+    console.log('排队等候的目录数量', limit.pendingCount)
+  }, LOG_DELAY)
+
+  async function recur (parent) {
+    let files, should_save
+    if (update) {
+      files = await limit(() => ls_folder({ fid: parent, not_teamdrive, service_account }))
+      should_save = true
+    } else {
+      const record = db.prepare('SELECT * FROM gd WHERE fid = ?').get(parent)
+      if (record) {
+        files = JSON.parse(record.info)
+      } else {
+        files = await limit(() => ls_folder({ fid: parent, not_teamdrive, service_account }))
+        should_save = true
+      }
+    }
+    if (!files) return
+    if (files.not_finished) not_finished.push(parent)
+    should_save && save_files_to_db(parent, files)
+    const folders = files.filter(v => v.mimeType === FOLDER_TYPE)
+    files.forEach(v => v.parent = parent)
+    result.push(...files)
+    return Promise.all(folders.map(v => recur(v.id)))
+  }
+  await recur(fid)
+  console.log('信息获取完毕')
+  not_finished.length ? console.log('未读取完毕的目录ID：', JSON.stringify(not_finished)) : console.log('所有目录读取完毕')
+  clearInterval(loop)
+  const smy = summary(result)
+  db.prepare('UPDATE gd SET summary=?, mtime=? WHERE fid=?').run(JSON.stringify(smy), Date.now(), fid)
+  return result
+}
+
+function save_files_to_db (fid, files) {
+  // 不保存请求未完成的目录，那么下次调用get_all_by_id会返回null，从而再次调用walk_and_save试图完成此目录的请求
+  if (files.not_finished) return
+  let subf = files.filter(v => v.mimeType === FOLDER_TYPE).map(v => v.id)
+  subf = subf.length ? JSON.stringify(subf) : null
+  const exists = db.prepare('SELECT fid FROM gd WHERE fid = ?').get(fid)
+  if (exists) {
+    db.prepare('UPDATE gd SET info=?, subf=?, mtime=? WHERE fid=?')
+      .run(JSON.stringify(files), subf, Date.now(), fid)
+  } else {
+    db.prepare('INSERT INTO gd (fid, info, subf, ctime) VALUES (?, ?, ?, ?)')
+      .run(fid, JSON.stringify(files), subf, Date.now())
+  }
+}
+
+async function ls_folder ({ fid, not_teamdrive, service_account }) {
+  let files = []
+  let pageToken
+  const search_all = { includeItemsFromAllDrives: true, supportsAllDrives: true }
+  const params = ((fid === 'root') || not_teamdrive) ? {} : search_all
+  params.q = `'${fid}' in parents and trashed = false`
+  params.orderBy = 'folder,name desc'
+  params.fields = 'nextPageToken, files(id, name, mimeType, size, md5Checksum)'
+  params.pageSize = Math.min(PAGE_SIZE, 1000)
+  const use_sa = (fid !== 'root') && (service_account || !not_teamdrive) // 不带参数默认使用sa
+  const headers = await gen_headers(use_sa)
+  do {
+    if (pageToken) params.pageToken = pageToken
+    let url = 'https://www.googleapis.com/drive/v3/files'
+    url += '?' + params_to_query(params)
+    const payload = { headers, timeout: TIMEOUT_BASE }
+    let retry = 0
+    let data
+    while (!data && (retry < RETRY_LIMIT)) {
+      try {
+        data = (await axins.get(url, payload)).data
+      } catch (err) {
+        handle_error(err)
+        retry++
+        payload.timeout = Math.min(payload.timeout * 2, TIMEOUT_MAX)
+      }
+    }
+    if (!data) {
+      console.error('读取目录未完成(部分读取), 参数:', params)
+      files.not_finished = true
+      return files
+    }
+    files = files.concat(data.files)
+    pageToken = data.nextPageToken
+  } while (pageToken)
+
+  return files
+}
+
+async function gen_headers (use_sa) {
+  use_sa = use_sa && SA_TOKENS.length
+  const access_token = use_sa ? (await get_sa_token()).access_token : (await get_access_token())
+  return { authorization: 'Bearer ' + access_token }
+}
+
+function params_to_query (data) {
+  const ret = []
+  for (let d in data) {
+    ret.push(encodeURIComponent(d) + '=' + encodeURIComponent(data[d]))
+  }
+  return ret.join('&')
+}
+
+async function get_access_token () {
+  const { expires, access_token, client_id, client_secret, refresh_token } = AUTH
+  if (expires > Date.now()) return access_token
+
+  const url = 'https://www.googleapis.com/oauth2/v4/token'
+  const headers = { 'Content-Type': 'application/x-www-form-urlencoded' }
+  const config = { headers }
+  const params = { client_id, client_secret, refresh_token, grant_type: 'refresh_token' }
+  const { data } = await axins.post(url, params_to_query(params), config)
+  // console.log('Got new token:', data)
+  AUTH.access_token = data.access_token
+  AUTH.expires = Date.now() + 1000 * data.expires_in
+  return data.access_token
+}
+
+async function get_sa_token () {
+  const el = get_random_element(SA_TOKENS)
+  const { value, expires, gtoken } = el
+  // 把gtoken传递出去的原因是当某账号流量用尽时可以依此过滤
+  if (Date.now() < expires) return { access_token: value, gtoken }
+  return new Promise((resolve, reject) => {
+    gtoken.getToken((err, tokens) => {
+      if (err) {
+        reject(err)
+      } else {
+        // console.log('got sa token', tokens)
+        const { access_token, expires_in } = tokens
+        el.value = access_token
+        el.expires = Date.now() + 1000 * expires_in
+        resolve({ access_token, gtoken })
+      }
+    })
+  })
+}
+
+function get_random_element (arr) {
+  return arr[~~(arr.length * Math.random())]
+}
+
+function validate_fid (fid) {
+  if (!fid) return false
+  fid = String(fid)
+  const whitelist = ['root', 'appDataFolder', 'photos']
+  if (whitelist.includes(fid)) return true
+  if (fid.length < 10 || fid.length > 100) return false
+  const reg = /^[a-zA-Z0-9_-]+$/
+  return fid.match(reg)
+}
+
+async function create_folder (name, parent, use_sa) {
+  let url = `https://www.googleapis.com/drive/v3/files`
+  const params = { supportsAllDrives: true }
+  url += '?' + params_to_query(params)
+  const post_data = {
+    name,
+    mimeType: FOLDER_TYPE,
+    parents: [parent]
+  }
+  const headers = await gen_headers(use_sa)
+  const config = { headers }
+  let retry = 0
+  let data
+  while (!data && (retry < RETRY_LIMIT)) {
+    try {
+      data = (await axins.post(url, post_data, config)).data
+    } catch (err) {
+      retry++
+      handle_error(err)
+      console.log('创建目录重试中：', name, '重试次数：', retry)
+    }
+  }
+  return data
+}
+
+async function get_info_by_id (fid, use_sa) {
+  let url = `https://www.googleapis.com/drive/v3/files/${fid}`
+  let params = {
+    includeItemsFromAllDrives: true,
+    supportsAllDrives: true,
+    corpora: 'allDrives',
+    fields: 'id,name,owners'
+  }
+  url += '?' + params_to_query(params)
+  const headers = await gen_headers(use_sa)
+  const { data } = await axins.get(url, { headers })
+  return data
+}
+
+async function user_choose () {
+  const answer = await prompts({
+    type: 'select',
+    name: 'value',
+    message: '检测到上次的复制记录，是否继续？',
+    choices: [
+      { title: 'Continue', description: '从上次中断的地方继续', value: 'continue' },
+      { title: 'Restart', description: '无视已存在的记录，重新复制', value: 'restart' },
+      { title: 'Exit', description: '直接退出', value: 'exit' }
+    ],
+    initial: 0
+  })
+  return answer.value
+}
+
+async function copy ({ source, target, name, min_size, update, not_teamdrive, service_account, is_server }) {
+  target = target || DEFAULT_TARGET
+  if (!target) throw new Error('目标位置不能为空')
+
+  const record = db.prepare('select id, status from task where source=? and target=?').get(source, target)
+  if (record && record.status === 'copying') return console.log('已有相同源和目的地的任务正在运行，强制退出')
+
+  try {
+    return await real_copy({ source, target, name, min_size, update, not_teamdrive, service_account, is_server })
+  } catch (err) {
+    console.error('复制文件夹出错', err)
+    const record = db.prepare('select id, status from task where source=? and target=?').get(source, target)
+    if (record) db.prepare('update task set status=? where id=?').run('error', record.id)
+  }
+}
+
+// 待解决：如果用户手动ctrl+c中断进程，那么已经发出的请求，就算完成了也不会记录到本地数据库中，所以可能产生重复文件（夹）
+async function real_copy ({ source, target, name, min_size, update, not_teamdrive, service_account, is_server }) {
+  async function get_new_root () {
+    if (name) {
+      return create_folder(name, target, service_account)
+    } else {
+      const source_info = await get_info_by_id(source, service_account)
+      return create_folder(source_info.name, target, service_account)
+    }
+  }
+
+  const record = db.prepare('select * from task where source=? and target=?').get(source, target)
+  if (record) {
+    const choice = is_server ? 'continue' : await user_choose()
+    if (choice === 'exit') {
+      return console.log('退出程序')
+    } else if (choice === 'continue') {
+      let { copied, mapping } = record
+      const copied_ids = {}
+      const old_mapping = {}
+      copied = copied.trim().split('\n')
+      copied.forEach(id => copied_ids[id] = true)
+      mapping = mapping.trim().split('\n').map(line => line.split(' '))
+      const root = mapping[0][1]
+      mapping.forEach(arr => old_mapping[arr[0]] = arr[1])
+      db.prepare('update task set status=? where id=?').run('copying', record.id)
+      const arr = await walk_and_save({ fid: source, update, not_teamdrive, service_account })
+      let files = arr.filter(v => v.mimeType !== FOLDER_TYPE).filter(v => !copied_ids[v.id])
+      if (min_size) files = files.filter(v => v.size >= min_size)
+      const folders = arr.filter(v => v.mimeType === FOLDER_TYPE).filter(v => !old_mapping[v.id])
+      console.log('待复制的目录数：', folders.length)
+      console.log('待复制的文件数：', files.length)
+      const all_mapping = await create_folders({
+        old_mapping,
+        source,
+        folders,
+        service_account,
+        root,
+        task_id: record.id
+      })
+      await copy_files({ files, mapping: all_mapping, root, task_id: record.id })
+      db.prepare('update task set status=?, ftime=? where id=?').run('finished', Date.now(), record.id)
+      return { id: root }
+    } else if (choice === 'restart') {
+      const new_root = await get_new_root()
+      if (!new_root) throw new Error('创建目录失败，请检查您的帐号是否有相应的权限')
+      const root_mapping = source + ' ' + new_root.id + '\n'
+      db.prepare('update task set status=?, copied=?, mapping=? where id=?')
+        .run('copying', '', root_mapping, record.id)
+      const arr = await walk_and_save({ fid: source, update: true, not_teamdrive, service_account })
+      let files = arr.filter(v => v.mimeType !== FOLDER_TYPE)
+      if (min_size) files = files.filter(v => v.size >= min_size)
+      const folders = arr.filter(v => v.mimeType === FOLDER_TYPE)
+      console.log('待复制的目录数：', folders.length)
+      console.log('待复制的文件数：', files.length)
+      const mapping = await create_folders({
+        source,
+        folders,
+        service_account,
+        root: new_root.id,
+        task_id: record.id
+      })
+      await copy_files({ files, mapping, root: new_root.id, task_id: record.id })
+      db.prepare('update task set status=?, ftime=? where id=?').run('finished', Date.now(), record.id)
+      return new_root
+    } else {
+      // ctrl+c 退出
+      return console.log('退出程序')
+    }
+  } else {
+    const new_root = await get_new_root()
+    if (!new_root) throw new Error('创建目录失败，请检查您的帐号是否有相应的权限')
+    const root_mapping = source + ' ' + new_root.id + '\n'
+    const { lastInsertRowid } = db.prepare('insert into task (source, target, status, mapping, ctime) values (?, ?, ?, ?, ?)').run(source, target, 'copying', root_mapping, Date.now())
+    const arr = await walk_and_save({ fid: source, update, not_teamdrive, service_account })
+    let files = arr.filter(v => v.mimeType !== FOLDER_TYPE)
+    if (min_size) files = files.filter(v => v.size >= min_size)
+    const folders = arr.filter(v => v.mimeType === FOLDER_TYPE)
+    console.log('待复制的目录数：', folders.length)
+    console.log('待复制的文件数：', files.length)
+    const mapping = await create_folders({
+      source,
+      folders,
+      service_account,
+      root: new_root.id,
+      task_id: lastInsertRowid
+    })
+    await copy_files({ files, mapping, root: new_root.id, task_id: lastInsertRowid })
+    db.prepare('update task set status=?, ftime=? where id=?').run('finished', Date.now(), lastInsertRowid)
+    return new_root
+  }
+}
+
+async function copy_files ({ files, mapping, root, task_id }) {
+  console.log('开始复制文件，总数：', files.length)
+  const limit = pLimit(PARALLEL_LIMIT)
+  let count = 0
+  const loop = setInterval(() => {
+    console.log('================')
+    console.log('已复制的文件数量', count)
+    console.log('正在进行的网络请求', limit.activeCount)
+    console.log('排队等候的文件数量', limit.pendingCount)
+  }, LOG_DELAY)
+  await Promise.all(files.map(async file => {
+    const { id, parent } = file
+    const target = mapping[parent] || root
+    const new_file = await limit(() => copy_file(id, target))
+    if (new_file) {
+      db.prepare('update task set status=?, copied = copied || ? where id=?').run('copying', id + '\n', task_id)
+    }
+    count++
+  }))
+  clearInterval(loop)
+}
+
+async function copy_file (id, parent) {
+  let url = `https://www.googleapis.com/drive/v3/files/${id}/copy`
+  let params = { supportsAllDrives: true }
+  url += '?' + params_to_query(params)
+  const config = {}
+  let retry = 0
+  while (retry < RETRY_LIMIT) {
+    let gtoken
+    if (SA_TOKENS.length) { // 如果有sa文件则优先使用
+      const temp = await get_sa_token()
+      gtoken = temp.gtoken
+      config.headers = { authorization: 'Bearer ' + temp.access_token }
+    } else {
+      config.headers = await gen_headers()
+    }
+    try {
+      const { data } = await axins.post(url, { parents: [parent] }, config)
+      return data
+    } catch (err) {
+      retry++
+      handle_error(err)
+      const data = err && err.response && err.response.data
+      const message = data && data.error && data.error.message
+      if (message && message.toLowerCase().includes('rate limit')) {
+        SA_TOKENS = SA_TOKENS.filter(v => v.gtoken !== gtoken)
+        console.log('此帐号触发使用限额，剩余可用service account帐号数量：', SA_TOKENS.length)
+      }
+    }
+  }
+  if (!SA_TOKENS.length) {
+    throw new Error('所有SA帐号流量已用完')
+  } else {
+    console.warn('复制文件失败，文件id: ' + id)
+  }
+}
+
+async function create_folders ({ source, old_mapping, folders, root, task_id, service_account }) {
+  if (!Array.isArray(folders)) throw new Error('folders must be Array:' + folders)
+  const mapping = old_mapping || {}
+  mapping[source] = root
+  if (!folders.length) return mapping
+
+  console.log('开始复制文件夹，总数：', folders.length)
+  const limit = pLimit(PARALLEL_LIMIT)
+  let count = 0
+  let same_levels = folders.filter(v => v.parent === folders[0].parent)
+
+  const loop = setInterval(() => {
+    console.log('================')
+    console.log('已创建的文件夹数量', count)
+    console.log('正在进行的网络请求', limit.activeCount)
+    console.log('排队等候的目录数量', limit.pendingCount)
+  }, LOG_DELAY)
+
+  while (same_levels.length) {
+    await Promise.all(same_levels.map(async v => {
+      const { name, id, parent } = v
+      const target = mapping[parent] || root
+      const new_folder = await limit(() => create_folder(name, target, service_account))
+      count++
+      mapping[id] = new_folder.id
+      const mapping_record = id + ' ' + new_folder.id + '\n'
+      db.prepare('update task set status=?, mapping = mapping || ? where id=?').run('copying', mapping_record, task_id)
+    }))
+    folders = folders.filter(v => !mapping[v.id])
+    same_levels = [].concat(...same_levels.map(v => folders.filter(vv => vv.parent === v.id)))
+  }
+
+  clearInterval(loop)
+  return mapping
+}
+
+function find_dupe (arr) {
+  const files = arr.filter(v => v.mimeType !== FOLDER_TYPE)
+  const folders = arr.filter(v => v.mimeType === FOLDER_TYPE)
+  const exists = {}
+  const dupe_files = []
+  const dupe_folder_keys = {}
+  for (const folder of folders) {
+    const { parent, name } = folder
+    const key = parent + '|' + name
+    if (exists[key]) {
+      dupe_folder_keys[key] = true
+    } else {
+      exists[key] = true
+    }
+  }
+  const dupe_empty_folders = folders.filter(folder => {
+    const { parent, name } = folder
+    const key = parent + '|' + name
+    return dupe_folder_keys[key]
+  }).filter(folder => {
+    const has_child = arr.some(v => v.parent === folder.id)
+    return !has_child
+  })
+  for (const file of files) {
+    const { md5Checksum, parent, name } = file
+    // 根据文件位置和md5值来判断是否重复
+    const key = parent + '|' + md5Checksum // + '|' + name
+    if (exists[key]) {
+      dupe_files.push(file)
+    } else {
+      exists[key] = true
+    }
+  }
+  return dupe_files.concat(dupe_empty_folders)
+}
+
+async function confirm_dedupe ({ file_number, folder_number }) {
+  const answer = await prompts({
+    type: 'select',
+    name: 'value',
+    message: `检测到重复文件${file_number}个，重复目录${folder_number}个，是否删除？`,
+    choices: [
+      { title: 'Yes', description: '确认删除', value: 'yes' },
+      { title: 'No', description: '先不删除', value: 'no' }
+    ],
+    initial: 0
+  })
+  return answer.value
+}
+
+// 可以删除文件或文件夹，似乎不会进入回收站
+async function rm_file ({ fid, service_account }) {
+  const headers = await gen_headers(service_account)
+  let retry = 0
+  const url = `https://www.googleapis.com/drive/v3/files/${fid}?supportsAllDrives=true`
+  while (retry < RETRY_LIMIT) {
+    try {
+      return await axins.delete(url, { headers })
+    } catch (err) {
+      retry++
+      handle_error(err)
+      console.log('删除重试中，重试次数', retry)
+    }
+  }
+}
+
+async function dedupe ({ fid, update, service_account }) {
+  let arr
+  if (!update) {
+    const info = get_all_by_fid(fid)
+    if (info) {
+      console.log('找到本地缓存数据，缓存时间：', dayjs(info.mtime).format('YYYY-MM-DD HH:mm:ss'))
+      arr = info
+    }
+  }
+  arr = arr || await walk_and_save({ fid, update, service_account })
+  const dupes = find_dupe(arr)
+  const folder_number = dupes.filter(v => v.mimeType === FOLDER_TYPE).length
+  const file_number = dupes.length - folder_number
+  const choice = await confirm_dedupe({ file_number, folder_number })
+  if (choice === 'no') {
+    return console.log('退出程序')
+  } else if (!choice) {
+    return // ctrl+c
+  }
+  const limit = pLimit(PARALLEL_LIMIT)
+  let folder_count = 0
+  let file_count = 0
+  await Promise.all(dupes.map(async v => {
+    try {
+      await limit(() => rm_file({ fid: v.id, service_account }))
+      if (v.mimeType === FOLDER_TYPE) {
+        console.log('成功删除文件夹', v.name)
+        folder_count++
+      } else {
+        console.log('成功删除文件', v.name)
+        file_count++
+      }
+    } catch (e) {
+      console.log('删除失败', e.message)
+    }
+  }))
+  return { file_count, folder_count }
+}
+
+function handle_error (err) {
+  const data = err && err.response && err.response.data
+  data ? console.error(JSON.stringify(data)) : console.error(err.message)
+}
+
+module.exports = { ls_folder, count, validate_fid, copy, dedupe, copy_file, gen_count_body, real_copy }
--- a/src/router.js
+++ b/src/router.js
@ -0,0 +1,113 @@
+const Router = require('@koa/router')
+
+const { db } = require('../db')
+const { validate_fid, gen_count_body } = require('./gd')
+const { send_count, send_help, send_choice, send_task_info, sm, extract_fid, reply_cb_query, tg_copy, send_all_tasks } = require('./tg')
+
+const { AUTH } = require('../config')
+const { tg_whitelist } = AUTH
+
+const counting = {}
+const router = new Router()
+
+router.get('/api/gdurl/count', async ctx => {
+  const { query, headers } = ctx.request
+  let { fid, type, update } = query
+  if (!validate_fid(fid)) throw new Error('无效的分享ID')
+  let ua = headers['user-agent'] || ''
+  ua = ua.toLowerCase()
+  type = (type || '').toLowerCase()
+  if (!type) {
+    if (ua.includes('curl')) {
+      type = 'curl'
+    } else if (ua.includes('mozilla')) {
+      type = 'html'
+    } else {
+      type = 'json'
+    }
+  }
+  if (type === 'html') {
+    ctx.set('Content-Type', 'text/html; charset=utf-8')
+  } else if (['json', 'all'].includes(type)) {
+    ctx.set('Content-Type', 'application/json; charset=UTF-8')
+  }
+  ctx.body = await gen_count_body({ fid, type, update, service_account: true })
+})
+
+router.post('/api/gdurl/tgbot', async ctx => {
+  const { body } = ctx.request
+  console.log('ctx.ip', ctx.ip) // 可以只允许tg服务器的ip
+  console.log('tg message:', body)
+  ctx.body = '' // 早点释放连接
+  const message = body.message || body.edited_message
+
+  const { callback_query } = body
+  if (callback_query) {
+    const { id, data } = callback_query
+    const chat_id = callback_query.from.id
+    const [action, fid] = data.split(' ')
+    if (action === 'count') {
+      if (counting[fid]) return sm({ chat_id, text: fid + ' 正在统计，请稍等片刻' })
+      counting[fid] = true
+      send_count({ fid, chat_id }).catch(err => {
+        console.error(err)
+        sm({ chat_id, text: fid + ' 统计失败：' + err.message })
+      }).finally(() => {
+        delete counting[fid]
+      })
+    } else if (action === 'copy') {
+      tg_copy({ fid, chat_id }).then(task_id => {
+        task_id && sm({ chat_id, text: `开始复制，任务ID: ${task_id} 可输入 /task ${task_id} 查询进度` })
+      })
+    }
+    return reply_cb_query({ id, data }).catch(console.error)
+  }
+
+  const chat_id = message && message.chat && message.chat.id
+  const text = message && message.text && message.text.trim()
+  const username = message && message.from && message.from.username
+  if (!chat_id || !text || !tg_whitelist.includes(username)) return console.warn('异常请求')
+
+  const fid = extract_fid(text)
+  const no_fid_commands = ['/task', '/help']
+  if (!no_fid_commands.some(cmd => text.startsWith(cmd)) && !validate_fid(fid)) {
+    return sm({ chat_id, text: '未识别出分享ID' })
+  }
+  if (text.startsWith('/help')) return send_help(chat_id)
+  if (text.startsWith('https://drive.google.com/')) {
+    return send_choice({ fid, chat_id }).catch(console.error)
+  }
+  if (text.startsWith('/count')) {
+    if (counting[fid]) return sm({ chat_id, text: fid + ' 正在统计，请稍等片刻' })
+    try {
+      counting[fid] = true
+      await send_count({ fid, chat_id })
+    } catch (err) {
+      console.error(err)
+      sm({ chat_id, text: fid + ' 统计失败：' + err.message })
+    } finally {
+      delete counting[fid]
+    }
+  } else if (text.startsWith('/copy')) {
+    const target = text.replace('/copy', '').trim().split(' ').map(v => v.trim())[1]
+    tg_copy({ fid, target, chat_id }).then(task_id => {
+      task_id && sm({ chat_id, text: `开始复制，任务ID: ${task_id} 可输入 /task ${task_id} 查询进度` })
+    })
+  } else if (text.startsWith('/task')) {
+    let task_id = text.replace('/task', '').trim()
+    if (task_id === 'all') {
+      return send_all_tasks(chat_id)
+    }
+    task_id = parseInt(task_id)
+    if (!task_id) {
+      const running_tasks = db.prepare('select id from task where status=?').all('copying')
+      if (!running_tasks.length) return sm({ chat_id, text: '当前暂无运行中的任务' })
+      return running_tasks.forEach(v => send_task_info({ chat_id, task_id: v.id }).catch(console.error))
+    }
+    send_task_info({ task_id, chat_id }).catch(console.error)
+  } else {
+    sm({ chat_id, text: '暂不支持此命令' })
+  }
+})
+
+module.exports = router
--- a/src/summary.js
+++ b/src/summary.js
@ -0,0 +1,126 @@
+const Table = require('cli-table3')
+const colors = require('colors/safe')
+const { escape } = require('html-escaper')
+
+module.exports = { make_table, summary, make_html, make_tg_table }
+
+function make_html ({ file_count, folder_count, total_size, details }) {
+  const head = ['类型', '数量', '大小']
+  const th = '<tr>' + head.map(k => `<th>${k}</th>`).join('') + '</tr>'
+  const td = details.map(v => '<tr>' + [escape(v.ext), v.count, v.size].map(k => `<td>${k}</td>`).join('') + '</tr>').join('')
+  let tail = ['合计', file_count + folder_count, total_size]
+  tail = '<tr style="font-weight:bold">' + tail.map(k => `<td>${k}</td>`).join('') + '</tr>'
+  const table = `<table border="1" cellpadding="12" style="border-collapse:collapse;font-family:serif;font-size:22px;margin:10px auto;text-align: center">
+    ${th}
+    ${td}
+    ${tail}
+  </table>`
+  return table
+}
+
+function make_table ({ file_count, folder_count, total_size, details }) {
+  const tb = new Table()
+  const hAlign = 'center'
+  const headers = ['Type', 'Count', 'Size'].map(v => ({ content: colors.bold.brightBlue(v), hAlign }))
+  const records = details.map(v => [v.ext, v.count, v.size]).map(arr => {
+    return arr.map(content => ({ content, hAlign }))
+  })
+  const total_count = file_count + folder_count
+  const tails = ['总计', total_count, total_size].map(v => ({ content: colors.bold(v), hAlign }))
+  tb.push(headers, ...records)
+  tb.push(tails)
+  return tb.toString() + '\n'
+}
+
+function make_tg_table ({ file_count, folder_count, total_size, details }) {
+  const tb = new Table({
+    // chars: {
+    //   'top': '═',
+    //   'top-mid': '╤',
+    //   'top-left': '╔',
+    //   'top-right': '╗',
+    //   'bottom': '═',
+    //   'bottom-mid': '╧',
+    //   'bottom-left': '╚',
+    //   'bottom-right': '╝',
+    //   'left': '║',
+    //   'left-mid': '╟',
+    //   'right': '║',
+    //   'right-mid': '╢'
+    // },
+    style: {
+      head: [],
+      border: []
+    }
+  })
+  const hAlign = 'center'
+  const headers = ['Type', 'Count', 'Size'].map(v => ({ content: v, hAlign }))
+  details.forEach(v => {
+    if (v.ext === '文件夹') v.ext = '[Folder]'
+    if (v.ext === '无扩展名') v.ext = '[NoExt]'
+  })
+  const records = details.map(v => [v.ext, v.count, v.size]).map(arr => arr.map(content => ({ content, hAlign })))
+  const total_count = file_count + folder_count
+  const tails = ['Total', total_count, total_size].map(v => ({ content: v, hAlign }))
+  tb.push(headers, ...records)
+  tb.push(tails)
+  return tb.toString().replace(/─/g, '—') // 防止在手机端表格换行 去掉replace后在pc端更美观
+}
+
+function summary (info, sort_by) {
+  const files = info.filter(v => v.mimeType !== 'application/vnd.google-apps.folder')
+  const file_count = files.length
+  const folder_count = info.filter(v => v.mimeType === 'application/vnd.google-apps.folder').length
+  let total_size = info.map(v => Number(v.size) || 0).reduce((acc, val) => acc + val, 0)
+  total_size = format_size(total_size)
+  const exts = {}
+  const sizes = {}
+  let no_ext = 0; let no_ext_size = 0
+  files.forEach(v => {
+    let { name, size } = v
+    size = Number(size) || 0
+    const ext = name.split('.').pop().toLowerCase()
+    if (!name.includes('.') || ext.length > 10) { // 若 . 后超过10字符，判断为无扩展名
+      no_ext_size += size
+      return no_ext++
+    }
+    if (exts[ext]) {
+      exts[ext]++
+    } else {
+      exts[ext] = 1
+    }
+    if (sizes[ext]) {
+      sizes[ext] += size
+    } else {
+      sizes[ext] = size
+    }
+  })
+  const details = Object.keys(exts).map(ext => {
+    const count = exts[ext]
+    const size = sizes[ext]
+    return { ext, count, size: format_size(size), raw_size: size }
+  })
+  if (sort_by === 'size') {
+    details.sort((a, b) => b.raw_size - a.raw_size)
+  } else if (sort_by === 'name') {
+    details.sort((a, b) => (a.ext > b.ext) ? 1 : -1)
+  } else {
+    details.sort((a, b) => b.count - a.count)
+  }
+  if (no_ext) details.push({ ext: '无扩展名', count: no_ext, size: format_size(no_ext_size), raw_size: no_ext_size })
+  if (folder_count) details.push({ ext: '文件夹', count: folder_count, size: 0, raw_size: 0 })
+  return { file_count, folder_count, total_size, details }
+}
+
+function format_size (n) {
+  n = Number(n)
+  if (Number.isNaN(n)) return ''
+  if (n < 0) return 'invalid size'
+  const units = ['B', 'KB', 'MB', 'GB', 'TB', 'PB', 'EB', 'ZB', 'YB']
+  let flag = 0
+  while (n >= 1024) {
+    n = (n / 1024)
+    flag++
+  }
+  return n.toFixed(2) + ' ' + units[flag]
+}
--- a/src/tg.js
+++ b/src/tg.js
@ -0,0 +1,201 @@
+const Table = require('cli-table3')
+const dayjs = require('dayjs')
+const axios = require('@viegg/axios')
+const HttpsProxyAgent = require('https-proxy-agent')
+
+const { db } = require('../db')
+const { gen_count_body, validate_fid, real_copy } = require('./gd')
+const { AUTH, DEFAULT_TARGET } = require('../config')
+const { tg_token } = AUTH
+
+if (!tg_token) throw new Error('请先在auth.js里设置tg_token')
+const { https_proxy } = process.env
+const axins = axios.create(https_proxy ? { httpsAgent: new HttpsProxyAgent(https_proxy) } : {})
+
+module.exports = { send_count, send_help, sm, extract_fid, reply_cb_query, send_choice, send_task_info, send_all_tasks, tg_copy }
+
+function send_help (chat_id) {
+  const text = `<pre>[使用帮助]
+命令 ｜ 说明
+
+/help | 返回本条使用说明
+
+/count shareID | 返回sourceID的文件统计信息, sourceID可以是google drive分享网址本身，也可以是分享ID
+
+/copy sourceID targetID | 将sourceID的文件复制到targetID里（会新建一个文件夹），若不填targetID，则会复制到默认位置（在config.js里设置）。返回拷贝任务的taskID
+
+/task taskID | 返回对应任务的进度信息，若不填则返回所有正在运行的任务进度，若填 all 则返回所有任务列表
+</pre>`
+  return sm({ chat_id, text, parse_mode: 'HTML' })
+}
+
+function send_choice ({ fid, chat_id }) {
+  return sm({
+    chat_id,
+    text: `识别出分享ID ${fid}，请选择动作`,
+    reply_markup: {
+      inline_keyboard: [
+        [
+          { text: '文件统计', callback_data: `count ${fid}` },
+          { text: '开始复制', callback_data: `copy ${fid}` }
+        ]
+      ]
+    }
+  })
+}
+
+async function send_all_tasks (chat_id) {
+  let records = db.prepare('select id, status, ctime from task').all()
+  if (!records.length) return sm({ chat_id, text: '数据库中没有任务记录' })
+  const tb = new Table({ style: { head: [], border: [] } })
+  const headers = ['ID', 'status', 'ctime']
+  records = records.map(v => {
+    const { id, status, ctime } = v
+    return [id, status, dayjs(ctime).format('MM-DD HH:mm')]
+  })
+  tb.push(headers, ...records)
+  const text = tb.toString().replace(/─/g, '—')
+  const url = `https://api.telegram.org/bot${tg_token}/sendMessage`
+  return axins.post(url, {
+    chat_id,
+    parse_mode: 'HTML',
+    text: `所有拷贝任务：\n<pre>${text}</pre>`
+  }).catch(async err => {
+    const description = err.response && err.response.data && err.response.data.description
+    if (description && description.includes('message is too long')) {
+      const text = [headers].concat(records).map(v => v.join('\t')).join('\n')
+      return sm({ chat_id, parse_mode: 'HTML', text: `所有拷贝任务：\n<pre>${text}</pre>` })
+    }
+    console.error(err)
+  })
+}
+
+async function send_task_info ({ task_id, chat_id }) {
+  const record = db.prepare('select * from task where id=?').get(task_id)
+  if (!record) return sm({ chat_id, text: '数据库不存在此任务ID：' + task_id })
+
+  const gen_link = fid => `<a href="https://drive.google.com/drive/folders/${fid}">${fid}</a>`
+  const { source, target, status, copied, mapping, ctime, ftime } = record
+  const { summary } = db.prepare('select summary from gd where fid=?').get(source) || {}
+  const { file_count, folder_count, total_size } = summary ? JSON.parse(summary) : {}
+  const copied_files = copied ? copied.trim().split('\n').length : 0
+  const copied_folders = mapping ? (mapping.trim().split('\n').length - 1) : 0
+  let text = '任务编号：' + task_id + '\n'
+  text += '源ID：' + gen_link(source) + '\n'
+  text += '目的ID：' + gen_link(target) + '\n'
+  text += '任务状态：' + status + '\n'
+  text += '创建时间：' + dayjs(ctime).format('YYYY-MM-DD HH:mm') + '\n'
+  text += '完成时间：' + (ftime ? dayjs(ftime).format('YYYY-MM-DD HH:mm') : '未完成') + '\n'
+  text += '目录进度：' + copied_folders + '/' + (folder_count === undefined ? '未知数量' : folder_count) + '\n'
+  text += '文件进度：' + copied_files + '/' + (file_count === undefined ? '未知数量' : file_count) + '\n'
+  text += '总大小：' + (total_size || '未知大小')
+  return sm({ chat_id, text, parse_mode: 'HTML' })
+}
+
+async function tg_copy ({ fid, target, chat_id }) { // return task_id
+  target = target || DEFAULT_TARGET
+  if (!target) {
+    sm({ chat_id, text: '请输入目的地ID或先在config.js里设置默认复制目的地ID(DEFAULT_TARGET)' })
+    return
+  }
+
+  let record = db.prepare('select id, status from task where source=? and target=?').get(fid, target)
+  if (record) {
+    if (record.status === 'copying') {
+      sm({ chat_id, text: '已有相同源ID和目的ID的任务正在进行，查询进度可输入 /task ' + record.id })
+      return
+    } else if (record.status === 'finished') {
+      sm({ chat_id, text: '有相同源ID和目的ID的任务已复制完成，如需重新复制请更换目的地' })
+      return
+    }
+  }
+
+  real_copy({ source: fid, target, not_teamdrive: true, service_account: true, is_server: true })
+    .then(folder => {
+      if (!record) record = {} // 防止无限循环
+      if (!folder) return
+      const link = 'https://drive.google.com/drive/folders/' + folder.id
+      sm({ chat_id, text: `${fid} 复制完成，新文件夹链接：${link}` })
+    })
+    .catch(err => {
+      if (!record) record = {}
+      console.error('复制失败', fid, '-->', target)
+      console.error(err)
+      sm({ chat_id, text: '复制失败，失败消息：' + err.message })
+    })
+
+  while (!record) {
+    record = db.prepare('select id from task where source=? and target=?').get(fid, target)
+    await sleep(1000)
+  }
+  return record.id
+}
+
+function sleep (ms) {
+  return new Promise((resolve, reject) => {
+    setTimeout(resolve, ms)
+  })
+}
+
+function reply_cb_query ({ id, data }) {
+  const url = `https://api.telegram.org/bot${tg_token}/answerCallbackQuery`
+  return axins.post(url, {
+    callback_query_id: id,
+    text: '开始执行 ' + data
+  })
+}
+
+async function send_count ({ fid, chat_id }) {
+  const table = await gen_count_body({ fid, type: 'tg', service_account: true })
+  const url = `https://api.telegram.org/bot${tg_token}/sendMessage`
+  const gd_link = `https://drive.google.com/drive/folders/${fid}`
+  return axins.post(url, {
+    chat_id,
+    parse_mode: 'HTML',
+    text: `<pre>${gd_link}
+${table}</pre>`
+  }).catch(async err => {
+    const description = err.response && err.response.data && err.response.data.description
+    if (description && description.includes('message is too long')) {
+      const smy = await gen_count_body({ fid, type: 'json', service_account: true })
+      const { file_count, folder_count, total_size } = JSON.parse(smy)
+      return sm({
+        chat_id,
+        parse_mode: 'HTML',
+        text: `文件统计：<a href="https://drive.google.com/drive/folders/${fid}">${fid}</a>\n<pre>
+表格太长超出telegram消息限制，只显示概要：
+文件总数：${file_count}
+目录总数：${folder_count}
+合计大小：${total_size}
+</pre>`
+      })
+    }
+    throw err
+  })
+}
+
+function sm (data) {
+  const url = `https://api.telegram.org/bot${tg_token}/sendMessage`
+  return axins.post(url, data).catch(err => {
+    console.error('fail to post', url, data)
+    console.error(err)
+  })
+}
+
+function extract_fid (text) {
+  text = text.replace(/^\/count/, '').replace(/^\/copy/, '').trim()
+  const [source, target] = text.split(' ').map(v => v.trim())
+  if (validate_fid(source)) return source
+  try {
+    if (!text.startsWith('http')) text = 'https://' + text
+    const u = new URL(text)
+    if (u.pathname.includes('/folders/')) {
+      const reg = /\/folders\/([a-zA-Z0-9_-]{10,100})/
+      const match = u.pathname.match(reg)
+      return match && match[1]
+    }
+    return u.searchParams.get('id')
+  } catch (e) {
+    return ''
+  }
+}
--- a/static/autorclone.png
+++ b/static/autorclone.png
--- a/static/choose.png
+++ b/static/choose.png
--- a/static/gclone.png
+++ b/static/gclone.png
--- a/static/gdurl.png
+++ b/static/gdurl.png