upstream/mercurial-mirror Commit - r40464:a0e7fa01

1

# sqlitestore.py - Storage backend that uses SQLite

1

# sqlitestore.py - Storage backend that uses SQLite

2

#

2

#

3

4

#

4

#

5

# This software may be used and distributed according to the terms of the

5

# This software may be used and distributed according to the terms of the

6

# GNU General Public License version 2 or any later version.

6

# GNU General Public License version 2 or any later version.

7

8

"""store repository data in SQLite (EXPERIMENTAL)

8

"""store repository data in SQLite (EXPERIMENTAL)

9

10

The sqlitestore extension enables the storage of repository data in SQLite.

10

The sqlitestore extension enables the storage of repository data in SQLite.

11

12

This extension is HIGHLY EXPERIMENTAL. There are NO BACKWARDS COMPATIBILITY

12

This extension is HIGHLY EXPERIMENTAL. There are NO BACKWARDS COMPATIBILITY

13

GUARANTEES. This means that repositories created with this extension may

13

GUARANTEES. This means that repositories created with this extension may

14

only be usable with the exact version of this extension/Mercurial that was

14

only be usable with the exact version of this extension/Mercurial that was

15

used. The extension attempts to enforce this in order to prevent repository

15

used. The extension attempts to enforce this in order to prevent repository

16

corruption.

16

corruption.

17

18

In addition, several features are not yet supported or have known bugs:

18

In addition, several features are not yet supported or have known bugs:

19

20

* Only some data is stored in SQLite. Changeset, manifest, and other repository

20

* Only some data is stored in SQLite. Changeset, manifest, and other repository

21

data is not yet stored in SQLite.

21

data is not yet stored in SQLite.

22

* Transactions are not robust. If the process is aborted at the right time

22

* Transactions are not robust. If the process is aborted at the right time

23

during transaction close/rollback, the repository could be in an inconsistent

23

during transaction close/rollback, the repository could be in an inconsistent

24

state. This problem will diminish once all repository data is tracked by

24

state. This problem will diminish once all repository data is tracked by

25

SQLite.

25

SQLite.

26

* Bundle repositories do not work (the ability to use e.g.

26

* Bundle repositories do not work (the ability to use e.g.

27

`hg -R <bundle-file> log` to automatically overlay a bundle on top of the

27

`hg -R <bundle-file> log` to automatically overlay a bundle on top of the

28

existing repository).

28

existing repository).

29

* Various other features don't work.

29

* Various other features don't work.

30

31

This extension should work for basic clone/pull, update, and commit workflows.

31

This extension should work for basic clone/pull, update, and commit workflows.

32

Some history rewriting operations may fail due to lack of support for bundle

32

Some history rewriting operations may fail due to lack of support for bundle

33

repositories.

33

repositories.

34

35

To use, activate the extension and set the ``storage.new-repo-backend`` config

35

To use, activate the extension and set the ``storage.new-repo-backend`` config

36

option to ``sqlite`` to enable new repositories to use SQLite for storage.

36

option to ``sqlite`` to enable new repositories to use SQLite for storage.

37

"""

37

"""

38

39

# To run the test suite with repos using SQLite by default, execute the

39

# To run the test suite with repos using SQLite by default, execute the

40

# following:

40

# following:

41

#

41

#

42

# HGREPOFEATURES="sqlitestore" run-tests.py \

42

# HGREPOFEATURES="sqlitestore" run-tests.py \

43

# --extra-config-opt extensions.sqlitestore= \

43

# --extra-config-opt extensions.sqlitestore= \

44

# --extra-config-opt storage.new-repo-backend=sqlite

44

# --extra-config-opt storage.new-repo-backend=sqlite

45

46

from __future__ import absolute_import

46

from __future__ import absolute_import

47

48

import hashlib

48

import hashlib

49

import sqlite3

49

import sqlite3

50

import struct

50

import struct

51

import threading

51

import threading

52

import zlib

52

import zlib

53

54

from mercurial.i18n import _

54

from mercurial.i18n import _

55

from mercurial.node import (

55

from mercurial.node import (

56

nullid,

56

nullid,

57

nullrev,

57

nullrev,

58

short,

58

short,

59

)

59

)

60

from mercurial.thirdparty import (

60

from mercurial.thirdparty import (

61

attr,

61

attr,

62

)

62

)

63

from mercurial import (

63

from mercurial import (

64

ancestor,

64

ancestor,

65

dagop,

65

dagop,

66

encoding,

66

encoding,

67

error,

67

error,

68

extensions,

68

extensions,

69

localrepo,

69

localrepo,

70

mdiff,

70

mdiff,

71

pycompat,

71

pycompat,

72

registrar,

72

registrar,

73

repository,

73

repository,

74

util,

74

util,

75

verify,

75

verify,

76

)

76

)

77

from mercurial.utils import (

77

from mercurial.utils import (

78

interfaceutil,

78

interfaceutil,

79

storageutil,

79

storageutil,

80

)

80

)

81

82

try:

82

try:

83

from mercurial import zstd

83

from mercurial import zstd

84

zstd.__version__

84

zstd.__version__

85

except ImportError:

85

except ImportError:

86

zstd = None

86

zstd = None

87

88

configtable = {}

88

configtable = {}

89

configitem = registrar.configitem(configtable)

89

configitem = registrar.configitem(configtable)

90

91

# experimental config: storage.sqlite.compression

91

# experimental config: storage.sqlite.compression

92

configitem('storage', 'sqlite.compression',

92

configitem('storage', 'sqlite.compression',

93

default='zstd' if zstd else 'zlib')

93

default='zstd' if zstd else 'zlib')

94

95

# Note for extension authors: ONLY specify testedwith = 'ships-with-hg-core' for

95

# Note for extension authors: ONLY specify testedwith = 'ships-with-hg-core' for

96

# extensions which SHIP WITH MERCURIAL. Non-mainline extensions should

96

# extensions which SHIP WITH MERCURIAL. Non-mainline extensions should

97

# be specifying the version(s) of Mercurial they are tested with, or

97

# be specifying the version(s) of Mercurial they are tested with, or

98

# leave the attribute unspecified.

98

# leave the attribute unspecified.

99

testedwith = 'ships-with-hg-core'

99

testedwith = 'ships-with-hg-core'

100

101

REQUIREMENT = b'exp-sqlite-001'

101

REQUIREMENT = b'exp-sqlite-001'

102

REQUIREMENT_ZSTD = b'exp-sqlite-comp-001=zstd'

102

REQUIREMENT_ZSTD = b'exp-sqlite-comp-001=zstd'

103

REQUIREMENT_ZLIB = b'exp-sqlite-comp-001=zlib'

103

REQUIREMENT_ZLIB = b'exp-sqlite-comp-001=zlib'

104

REQUIREMENT_NONE = b'exp-sqlite-comp-001=none'

104

REQUIREMENT_NONE = b'exp-sqlite-comp-001=none'

105

REQUIREMENT_SHALLOW_FILES = b'exp-sqlite-shallow-files'

105

REQUIREMENT_SHALLOW_FILES = b'exp-sqlite-shallow-files'

106

107

CURRENT_SCHEMA_VERSION = 1

107

CURRENT_SCHEMA_VERSION = 1

108

109

COMPRESSION_NONE = 1

109

COMPRESSION_NONE = 1

110

COMPRESSION_ZSTD = 2

110

COMPRESSION_ZSTD = 2

111

COMPRESSION_ZLIB = 3

111

COMPRESSION_ZLIB = 3

112

113

FLAG_CENSORED = 1

113

FLAG_CENSORED = 1

114

FLAG_MISSING_P1 = 2

114

FLAG_MISSING_P1 = 2

115

FLAG_MISSING_P2 = 4

115

FLAG_MISSING_P2 = 4

116

117

CREATE_SCHEMA = [

117

CREATE_SCHEMA = [

118

# Deltas are stored as content-indexed blobs.

118

# Deltas are stored as content-indexed blobs.

119

# compression column holds COMPRESSION_* constant for how the

119

# compression column holds COMPRESSION_* constant for how the

120

# delta is encoded.

120

# delta is encoded.

121

122

r'CREATE TABLE delta ('

122

r'CREATE TABLE delta ('

123

r' id INTEGER PRIMARY KEY, '

123

r' id INTEGER PRIMARY KEY, '

124

r' compression INTEGER NOT NULL, '

124

r' compression INTEGER NOT NULL, '

125

r' hash BLOB UNIQUE ON CONFLICT ABORT, '

125

r' hash BLOB UNIQUE ON CONFLICT ABORT, '

126

r' delta BLOB NOT NULL '

126

r' delta BLOB NOT NULL '

127

r')',

127

r')',

128

129

# Tracked paths are denormalized to integers to avoid redundant

129

# Tracked paths are denormalized to integers to avoid redundant

130

# storage of the path name.

130

# storage of the path name.

131

r'CREATE TABLE filepath ('

131

r'CREATE TABLE filepath ('

132

r' id INTEGER PRIMARY KEY, '

132

r' id INTEGER PRIMARY KEY, '

133

r' path BLOB NOT NULL '

133

r' path BLOB NOT NULL '

134

r')',

134

r')',

135

136

r'CREATE UNIQUE INDEX filepath_path '

136

r'CREATE UNIQUE INDEX filepath_path '

137

r' ON filepath (path)',

137

r' ON filepath (path)',

138

139

# We have a single table for all file revision data.

139

# We have a single table for all file revision data.

140

# Each file revision is uniquely described by a (path, rev) and

140

# Each file revision is uniquely described by a (path, rev) and

141

# (path, node).

141

# (path, node).

142

#

142

#

143

# Revision data is stored as a pointer to the delta producing this

143

# Revision data is stored as a pointer to the delta producing this

144

# revision and the file revision whose delta should be applied before

144

# revision and the file revision whose delta should be applied before

145

# that one. One can reconstruct the delta chain by recursively following

145

# that one. One can reconstruct the delta chain by recursively following

146

# the delta base revision pointers until one encounters NULL.

146

# the delta base revision pointers until one encounters NULL.

147

#

147

#

148

# flags column holds bitwise integer flags controlling storage options.

148

# flags column holds bitwise integer flags controlling storage options.

149

# These flags are defined by the FLAG_* constants.

149

# These flags are defined by the FLAG_* constants.

150

r'CREATE TABLE fileindex ('

150

r'CREATE TABLE fileindex ('

151

r' id INTEGER PRIMARY KEY, '

151

r' id INTEGER PRIMARY KEY, '

152

r' pathid INTEGER REFERENCES filepath(id), '

152

r' pathid INTEGER REFERENCES filepath(id), '

153

r' revnum INTEGER NOT NULL, '

153

r' revnum INTEGER NOT NULL, '

154

r' p1rev INTEGER NOT NULL, '

154

r' p1rev INTEGER NOT NULL, '

155

r' p2rev INTEGER NOT NULL, '

155

r' p2rev INTEGER NOT NULL, '

156

r' linkrev INTEGER NOT NULL, '

156

r' linkrev INTEGER NOT NULL, '

157

r' flags INTEGER NOT NULL, '

157

r' flags INTEGER NOT NULL, '

158

r' deltaid INTEGER REFERENCES delta(id), '

158

r' deltaid INTEGER REFERENCES delta(id), '

159

r' deltabaseid INTEGER REFERENCES fileindex(id), '

159

r' deltabaseid INTEGER REFERENCES fileindex(id), '

160

r' node BLOB NOT NULL '

160

r' node BLOB NOT NULL '

161

r')',

161

r')',

162

163

r'CREATE UNIQUE INDEX fileindex_pathrevnum '

163

r'CREATE UNIQUE INDEX fileindex_pathrevnum '

164

r' ON fileindex (pathid, revnum)',

164

r' ON fileindex (pathid, revnum)',

165

166

r'CREATE UNIQUE INDEX fileindex_pathnode '

166

r'CREATE UNIQUE INDEX fileindex_pathnode '

167

r' ON fileindex (pathid, node)',

167

r' ON fileindex (pathid, node)',

168

169

# Provide a view over all file data for convenience.

169

# Provide a view over all file data for convenience.

170

r'CREATE VIEW filedata AS '

170

r'CREATE VIEW filedata AS '

171

r'SELECT '

171

r'SELECT '

172

r' fileindex.id AS id, '

172

r' fileindex.id AS id, '

173

r' filepath.id AS pathid, '

173

r' filepath.id AS pathid, '

174

r' filepath.path AS path, '

174

r' filepath.path AS path, '

175

r' fileindex.revnum AS revnum, '

175

r' fileindex.revnum AS revnum, '

176

r' fileindex.node AS node, '

176

r' fileindex.node AS node, '

177

r' fileindex.p1rev AS p1rev, '

177

r' fileindex.p1rev AS p1rev, '

178

r' fileindex.p2rev AS p2rev, '

178

r' fileindex.p2rev AS p2rev, '

179

r' fileindex.linkrev AS linkrev, '

179

r' fileindex.linkrev AS linkrev, '

180

r' fileindex.flags AS flags, '

180

r' fileindex.flags AS flags, '

181

r' fileindex.deltaid AS deltaid, '

181

r' fileindex.deltaid AS deltaid, '

182

r' fileindex.deltabaseid AS deltabaseid '

182

r' fileindex.deltabaseid AS deltabaseid '

183

r'FROM filepath, fileindex '

183

r'FROM filepath, fileindex '

184

r'WHERE fileindex.pathid=filepath.id',

184

r'WHERE fileindex.pathid=filepath.id',

185

186

r'PRAGMA user_version=%d' % CURRENT_SCHEMA_VERSION,

186

r'PRAGMA user_version=%d' % CURRENT_SCHEMA_VERSION,

187

]

187

]

188

189

def resolvedeltachain(db, pathid, node, revisioncache,

189

def resolvedeltachain(db, pathid, node, revisioncache,

190

stoprids, zstddctx=None):

190

stoprids, zstddctx=None):

191

"""Resolve a delta chain for a file node."""

191

"""Resolve a delta chain for a file node."""

192

193

# TODO the "not in ({stops})" here is possibly slowing down the query

193

# TODO the "not in ({stops})" here is possibly slowing down the query

194

# because it needs to perform the lookup on every recursive invocation.

194

# because it needs to perform the lookup on every recursive invocation.

195

# This could possibly be faster if we created a temporary query with

195

# This could possibly be faster if we created a temporary query with

196

# baseid "poisoned" to null and limited the recursive filter to

196

# baseid "poisoned" to null and limited the recursive filter to

197

# "is not null".

197

# "is not null".

198

res = db.execute(

198

res = db.execute(

199

r'WITH RECURSIVE '

199

r'WITH RECURSIVE '

200

r' deltachain(deltaid, baseid) AS ('

200

r' deltachain(deltaid, baseid) AS ('

201

r' SELECT deltaid, deltabaseid FROM fileindex '

201

r' SELECT deltaid, deltabaseid FROM fileindex '

202

r' WHERE pathid=? AND node=? '

202

r' WHERE pathid=? AND node=? '

203

r' UNION ALL '

203

r' UNION ALL '

204

r' SELECT fileindex.deltaid, deltabaseid '

204

r' SELECT fileindex.deltaid, deltabaseid '

205

r' FROM fileindex, deltachain '

205

r' FROM fileindex, deltachain '

206

r' WHERE '

206

r' WHERE '

207

r' fileindex.id=deltachain.baseid '

207

r' fileindex.id=deltachain.baseid '

208

r' AND deltachain.baseid IS NOT NULL '

208

r' AND deltachain.baseid IS NOT NULL '

209

r' AND fileindex.id NOT IN ({stops}) '

209

r' AND fileindex.id NOT IN ({stops}) '

210

r' ) '

210

r' ) '

211

r'SELECT deltachain.baseid, compression, delta '

211

r'SELECT deltachain.baseid, compression, delta '

212

r'FROM deltachain, delta '

212

r'FROM deltachain, delta '

213

r'WHERE delta.id=deltachain.deltaid'.format(

213

r'WHERE delta.id=deltachain.deltaid'.format(

214

stops=r','.join([r'?'] * len(stoprids))),

214

stops=r','.join([r'?'] * len(stoprids))),

215

tuple([pathid, node] + list(stoprids.keys())))

215

tuple([pathid, node] + list(stoprids.keys())))

216

217

deltas = []

217

deltas = []

218

lastdeltabaseid = None

218

lastdeltabaseid = None

219

220

for deltabaseid, compression, delta in res:

220

for deltabaseid, compression, delta in res:

221

lastdeltabaseid = deltabaseid

221

lastdeltabaseid = deltabaseid

222

223

if compression == COMPRESSION_ZSTD:

223

if compression == COMPRESSION_ZSTD:

224

delta = zstddctx.decompress(delta)

224

delta = zstddctx.decompress(delta)

225

elif compression == COMPRESSION_NONE:

225

elif compression == COMPRESSION_NONE:

226

delta = delta

226

delta = delta

227

elif compression == COMPRESSION_ZLIB:

227

elif compression == COMPRESSION_ZLIB:

228

delta = zlib.decompress(delta)

228

delta = zlib.decompress(delta)

229

else:

229

else:

230

raise SQLiteStoreError('unhandled compression type: %d' %

230

raise SQLiteStoreError('unhandled compression type: %d' %

231

compression)

231

compression)

232

233

deltas.append(delta)

233

deltas.append(delta)

234

235

if lastdeltabaseid in stoprids:

235

if lastdeltabaseid in stoprids:

236

basetext = revisioncache[stoprids[lastdeltabaseid]]

236

basetext = revisioncache[stoprids[lastdeltabaseid]]

237

else:

237

else:

238

basetext = deltas.pop()

238

basetext = deltas.pop()

239

240

deltas.reverse()

240

deltas.reverse()

241

fulltext = mdiff.patches(basetext, deltas)

241

fulltext = mdiff.patches(basetext, deltas)

242

243

# SQLite returns buffer instances for blob columns on Python 2. This

243

# SQLite returns buffer instances for blob columns on Python 2. This

244

# type can propagate through the delta application layer. Because

244

# type can propagate through the delta application layer. Because

245

# downstream callers assume revisions are bytes, cast as needed.

245

# downstream callers assume revisions are bytes, cast as needed.

246

if not isinstance(fulltext, bytes):

246

if not isinstance(fulltext, bytes):

247

fulltext = bytes(delta)

247

fulltext = bytes(delta)

248

249

return fulltext

249

return fulltext

250

251

def insertdelta(db, compression, hash, delta):

251

def insertdelta(db, compression, hash, delta):

252

try:

252

try:

253

return db.execute(

253

return db.execute(

254

r'INSERT INTO delta (compression, hash, delta) '

254

r'INSERT INTO delta (compression, hash, delta) '

255

r'VALUES (?, ?, ?)',

255

r'VALUES (?, ?, ?)',

256

(compression, hash, delta)).lastrowid

256

(compression, hash, delta)).lastrowid

257

except sqlite3.IntegrityError:

257

except sqlite3.IntegrityError:

258

return db.execute(

258

return db.execute(

259

r'SELECT id FROM delta WHERE hash=?',

259

r'SELECT id FROM delta WHERE hash=?',

260

(hash,)).fetchone()[0]

260

(hash,)).fetchone()[0]

261

262

class SQLiteStoreError(error.StorageError):

262

class SQLiteStoreError(error.StorageError):

263

pass

263

pass

264

265

@attr.s

265

@attr.s

266

class revisionentry(object):

266

class revisionentry(object):

267

rid = attr.ib()

267

rid = attr.ib()

268

rev = attr.ib()

268

rev = attr.ib()

269

node = attr.ib()

269

node = attr.ib()

270

p1rev = attr.ib()

270

p1rev = attr.ib()

271

p2rev = attr.ib()

271

p2rev = attr.ib()

272

p1node = attr.ib()

272

p1node = attr.ib()

273

p2node = attr.ib()

273

p2node = attr.ib()

274

linkrev = attr.ib()

274

linkrev = attr.ib()

275

flags = attr.ib()

275

flags = attr.ib()

276

277

@interfaceutil.implementer(repository.irevisiondelta)

277

@interfaceutil.implementer(repository.irevisiondelta)

278

@attr.s(slots=True)

278

@attr.s(slots=True)

279

class sqliterevisiondelta(object):

279

class sqliterevisiondelta(object):

280

node = attr.ib()

280

node = attr.ib()

281

p1node = attr.ib()

281

p1node = attr.ib()

282

p2node = attr.ib()

282

p2node = attr.ib()

283

basenode = attr.ib()

283

basenode = attr.ib()

284

flags = attr.ib()

284

flags = attr.ib()

285

baserevisionsize = attr.ib()

285

baserevisionsize = attr.ib()

286

revision = attr.ib()

286

revision = attr.ib()

287

delta = attr.ib()

287

delta = attr.ib()

288

linknode = attr.ib(default=None)

288

linknode = attr.ib(default=None)

289

290

@interfaceutil.implementer(repository.iverifyproblem)

290

@interfaceutil.implementer(repository.iverifyproblem)

291

@attr.s(frozen=True)

291

@attr.s(frozen=True)

292

class sqliteproblem(object):

292

class sqliteproblem(object):

293

warning = attr.ib(default=None)

293

warning = attr.ib(default=None)

294

error = attr.ib(default=None)

294

error = attr.ib(default=None)

295

node = attr.ib(default=None)

295

node = attr.ib(default=None)

296

297

@interfaceutil.implementer(repository.ifilestorage)

297

@interfaceutil.implementer(repository.ifilestorage)

298

class sqlitefilestore(object):

298

class sqlitefilestore(object):

299

"""Implements storage for an individual tracked path."""

299

"""Implements storage for an individual tracked path."""

300

301

def __init__(self, db, path, compression):

301

def __init__(self, db, path, compression):

302

self._db = db

302

self._db = db

303

self._path = path

303

self._path = path

304

305

self._pathid = None

305

self._pathid = None

306

307

# revnum -> node

307

# revnum -> node

308

self._revtonode = {}

308

self._revtonode = {}

309

# node -> revnum

309

# node -> revnum

310

self._nodetorev = {}

310

self._nodetorev = {}

311

# node -> data structure

311

# node -> data structure

312

self._revisions = {}

312

self._revisions = {}

313

314

self._revisioncache = util.lrucachedict(10)

314

self._revisioncache = util.lrucachedict(10)

315

316

self._compengine = compression

316

self._compengine = compression

317

318

if compression == 'zstd':

318

if compression == 'zstd':

319

self._cctx = zstd.ZstdCompressor(level=3)

319

self._cctx = zstd.ZstdCompressor(level=3)

320

self._dctx = zstd.ZstdDecompressor()

320

self._dctx = zstd.ZstdDecompressor()

321

else:

321

else:

322

self._cctx = None

322

self._cctx = None

323

self._dctx = None

323

self._dctx = None

324

325

self._refreshindex()

325

self._refreshindex()

326

327

def _refreshindex(self):

327

def _refreshindex(self):

328

self._revtonode = {}

328

self._revtonode = {}

329

self._nodetorev = {}

329

self._nodetorev = {}

330

self._revisions = {}

330

self._revisions = {}

331

332

res = list(self._db.execute(

332

res = list(self._db.execute(

333

r'SELECT id FROM filepath WHERE path=?', (self._path,)))

333

r'SELECT id FROM filepath WHERE path=?', (self._path,)))

334

335

if not res:

335

if not res:

336

self._pathid = None

336

self._pathid = None

337

return

337

return

338

339

self._pathid = res[0][0]

339

self._pathid = res[0][0]

340

341

res = self._db.execute(

341

res = self._db.execute(

342

r'SELECT id, revnum, node, p1rev, p2rev, linkrev, flags '

342

r'SELECT id, revnum, node, p1rev, p2rev, linkrev, flags '

343

r'FROM fileindex '

343

r'FROM fileindex '

344

r'WHERE pathid=? '

344

r'WHERE pathid=? '

345

r'ORDER BY revnum ASC',

345

r'ORDER BY revnum ASC',

346

(self._pathid,))

346

(self._pathid,))

347

348

for i, row in enumerate(res):

348

for i, row in enumerate(res):

349

rid, rev, node, p1rev, p2rev, linkrev, flags = row

349

rid, rev, node, p1rev, p2rev, linkrev, flags = row

350

351

if i != rev:

351

if i != rev:

352

raise SQLiteStoreError(_('sqlite database has inconsistent '

352

raise SQLiteStoreError(_('sqlite database has inconsistent '

353

'revision numbers'))

353

'revision numbers'))

354

355

if p1rev == nullrev:

355

if p1rev == nullrev:

356

p1node = nullid

356

p1node = nullid

357

else:

357

else:

358

p1node = self._revtonode[p1rev]

358

p1node = self._revtonode[p1rev]

359

360

if p2rev == nullrev:

360

if p2rev == nullrev:

361

p2node = nullid

361

p2node = nullid

362

else:

362

else:

363

p2node = self._revtonode[p2rev]

363

p2node = self._revtonode[p2rev]

364

365

entry = revisionentry(

365

entry = revisionentry(

366

rid=rid,

366

rid=rid,

367

rev=rev,

367

rev=rev,

368

node=node,

368

node=node,

369

p1rev=p1rev,

369

p1rev=p1rev,

370

p2rev=p2rev,

370

p2rev=p2rev,

371

p1node=p1node,

371

p1node=p1node,

372

p2node=p2node,

372

p2node=p2node,

373

linkrev=linkrev,

373

linkrev=linkrev,

374

flags=flags)

374

flags=flags)

375

376

self._revtonode[rev] = node

376

self._revtonode[rev] = node

377

self._nodetorev[node] = rev

377

self._nodetorev[node] = rev

378

self._revisions[node] = entry

378

self._revisions[node] = entry

379

380

# Start of ifileindex interface.

380

# Start of ifileindex interface.

381

382

def __len__(self):

382

def __len__(self):

383

return len(self._revisions)

383

return len(self._revisions)

384

385

def __iter__(self):

385

def __iter__(self):

386

return iter(pycompat.xrange(len(self._revisions)))

386

return iter(pycompat.xrange(len(self._revisions)))

387

388

def hasnode(self, node):

388

def hasnode(self, node):

389

if node == nullid:

389

if node == nullid:

390

return False

390

return False

391

392

return node in self._nodetorev

392

return node in self._nodetorev

393

394

def revs(self, start=0, stop=None):

394

def revs(self, start=0, stop=None):

395

return storageutil.iterrevs(len(self._revisions), start=start,

395

return storageutil.iterrevs(len(self._revisions), start=start,

396

stop=stop)

396

stop=stop)

397

398

def parents(self, node):

398

def parents(self, node):

399

if node == nullid:

399

if node == nullid:

400

return nullid, nullid

400

return nullid, nullid

401

402

if node not in self._revisions:

402

if node not in self._revisions:

403

raise error.LookupError(node, self._path, _('no node'))

403

raise error.LookupError(node, self._path, _('no node'))

404

405

entry = self._revisions[node]

405

entry = self._revisions[node]

406

return entry.p1node, entry.p2node

406

return entry.p1node, entry.p2node

407

408

def parentrevs(self, rev):

408

def parentrevs(self, rev):

409

if rev == nullrev:

409

if rev == nullrev:

410

return nullrev, nullrev

410

return nullrev, nullrev

411

412

if rev not in self._revtonode:

412

if rev not in self._revtonode:

413

raise IndexError(rev)

413

raise IndexError(rev)

414

415

entry = self._revisions[self._revtonode[rev]]

415

entry = self._revisions[self._revtonode[rev]]

416

return entry.p1rev, entry.p2rev

416

return entry.p1rev, entry.p2rev

417

418

def rev(self, node):

418

def rev(self, node):

419

if node == nullid:

419

if node == nullid:

420

return nullrev

420

return nullrev

421

422

if node not in self._nodetorev:

422

if node not in self._nodetorev:

423

raise error.LookupError(node, self._path, _('no node'))

423

raise error.LookupError(node, self._path, _('no node'))

424

425

return self._nodetorev[node]

425

return self._nodetorev[node]

426

427

def node(self, rev):

427

def node(self, rev):

428

if rev == nullrev:

428

if rev == nullrev:

429

return nullid

429

return nullid

430

431

if rev not in self._revtonode:

431

if rev not in self._revtonode:

432

raise IndexError(rev)

432

raise IndexError(rev)

433

434

return self._revtonode[rev]

434

return self._revtonode[rev]

435

436

def lookup(self, node):

436

def lookup(self, node):

437

return storageutil.fileidlookup(self, node, self._path)

437

return storageutil.fileidlookup(self, node, self._path)

438

439

def linkrev(self, rev):

439

def linkrev(self, rev):

440

if rev == nullrev:

440

if rev == nullrev:

441

return nullrev

441

return nullrev

442

443

if rev not in self._revtonode:

443

if rev not in self._revtonode:

444

raise IndexError(rev)

444

raise IndexError(rev)

445

446

entry = self._revisions[self._revtonode[rev]]

446

entry = self._revisions[self._revtonode[rev]]

447

return entry.linkrev

447

return entry.linkrev

448

449

def iscensored(self, rev):

449

def iscensored(self, rev):

450

if rev == nullrev:

450

if rev == nullrev:

451

return False

451

return False

452

453

if rev not in self._revtonode:

453

if rev not in self._revtonode:

454

raise IndexError(rev)

454

raise IndexError(rev)

455

456

return self._revisions[self._revtonode[rev]].flags & FLAG_CENSORED

456

return self._revisions[self._revtonode[rev]].flags & FLAG_CENSORED

457

458

def commonancestorsheads(self, node1, node2):

458

def commonancestorsheads(self, node1, node2):

459

rev1 = self.rev(node1)

459

rev1 = self.rev(node1)

460

rev2 = self.rev(node2)

460

rev2 = self.rev(node2)

461

462

ancestors = ancestor.commonancestorsheads(self.parentrevs, rev1, rev2)

462

ancestors = ancestor.commonancestorsheads(self.parentrevs, rev1, rev2)

463

return pycompat.maplist(self.node, ancestors)

463

return pycompat.maplist(self.node, ancestors)

464

465

def descendants(self, revs):

465

def descendants(self, revs):

466

# TODO we could implement this using a recursive SQL query, which

466

# TODO we could implement this using a recursive SQL query, which

467

# might be faster.

467

# might be faster.

468

return dagop.descendantrevs(revs, self.revs, self.parentrevs)

468

return dagop.descendantrevs(revs, self.revs, self.parentrevs)

469

470

def heads(self, start=None, stop=None):

470

def heads(self, start=None, stop=None):

471

if start is None and stop is None:

471

if start is None and stop is None:

472

if not len(self):

472

if not len(self):

473

return [nullid]

473

return [nullid]

474

475

startrev = self.rev(start) if start is not None else nullrev

475

startrev = self.rev(start) if start is not None else nullrev

476

stoprevs = {self.rev(n) for n in stop or []}

476

stoprevs = {self.rev(n) for n in stop or []}

477

478

revs = dagop.headrevssubset(self.revs, self.parentrevs,

478

revs = dagop.headrevssubset(self.revs, self.parentrevs,

479

startrev=startrev, stoprevs=stoprevs)

479

startrev=startrev, stoprevs=stoprevs)

480

481

return [self.node(rev) for rev in revs]

481

return [self.node(rev) for rev in revs]

482

483

def children(self, node):

483

def children(self, node):

484

rev = self.rev(node)

484

rev = self.rev(node)

485

486

res = self._db.execute(

486

res = self._db.execute(

487

r'SELECT'

487

r'SELECT'

488

r' node '

488

r' node '

489

r' FROM filedata '

489

r' FROM filedata '

490

r' WHERE path=? AND (p1rev=? OR p2rev=?) '

490

r' WHERE path=? AND (p1rev=? OR p2rev=?) '

491

r' ORDER BY revnum ASC',

491

r' ORDER BY revnum ASC',

492

(self._path, rev, rev))

492

(self._path, rev, rev))

493

494

return [row[0] for row in res]

494

return [row[0] for row in res]

495

496

# End of ifileindex interface.

496

# End of ifileindex interface.

497

498

# Start of ifiledata interface.

498

# Start of ifiledata interface.

499

500

def size(self, rev):

500

def size(self, rev):

501

if rev == nullrev:

501

if rev == nullrev:

502

return 0

502

return 0

503

504

if rev not in self._revtonode:

504

if rev not in self._revtonode:

505

raise IndexError(rev)

505

raise IndexError(rev)

506

507

node = self._revtonode[rev]

507

node = self._revtonode[rev]

508

509

if self.renamed(node):

509

if self.renamed(node):

510

return len(self.read(node))

510

return len(self.read(node))

511

512

return len(self.revision(node))

512

return len(self.revision(node))

513

514

def revision(self, node, raw=False, _verifyhash=True):

514

def revision(self, node, raw=False, _verifyhash=True):

515

if node in (nullid, nullrev):

515

if node in (nullid, nullrev):

516

return b''

516

return b''

517

518

if isinstance(node, int):

518

if isinstance(node, int):

519

node = self.node(node)

519

node = self.node(node)

520

521

if node not in self._nodetorev:

521

if node not in self._nodetorev:

522

raise error.LookupError(node, self._path, _('no node'))

522

raise error.LookupError(node, self._path, _('no node'))

523

524

if node in self._revisioncache:

524

if node in self._revisioncache:

525

return self._revisioncache[node]

525

return self._revisioncache[node]

526

527

# Because we have a fulltext revision cache, we are able to

527

# Because we have a fulltext revision cache, we are able to

528

# short-circuit delta chain traversal and decompression as soon as

528

# short-circuit delta chain traversal and decompression as soon as

529

# we encounter a revision in the cache.

529

# we encounter a revision in the cache.

530

531

stoprids = {self._revisions[n].rid: n

531

stoprids = {self._revisions[n].rid: n

532

for n in self._revisioncache}

532

for n in self._revisioncache}

533

534

if not stoprids:

534

if not stoprids:

535

stoprids[-1] = None

535

stoprids[-1] = None

536

537

fulltext = resolvedeltachain(self._db, self._pathid, node,

537

fulltext = resolvedeltachain(self._db, self._pathid, node,

538

self._revisioncache, stoprids,

538

self._revisioncache, stoprids,

539

zstddctx=self._dctx)

539

zstddctx=self._dctx)

540

541

# Don't verify hashes if parent nodes were rewritten, as the hash

541

# Don't verify hashes if parent nodes were rewritten, as the hash

542

# wouldn't verify.

542

# wouldn't verify.

543

if self._revisions[node].flags & (FLAG_MISSING_P1 | FLAG_MISSING_P2):

543

if self._revisions[node].flags & (FLAG_MISSING_P1 | FLAG_MISSING_P2):

544

_verifyhash = False

544

_verifyhash = False

545

546

if _verifyhash:

546

if _verifyhash:

547

self._checkhash(fulltext, node)

547

self._checkhash(fulltext, node)

548

self._revisioncache[node] = fulltext

548

self._revisioncache[node] = fulltext

549

550

return fulltext

550

return fulltext

551

552

def read(self, node):

552

def read(self, node):

553

return storageutil.filtermetadata(self.revision(node))

553

return storageutil.filtermetadata(self.revision(node))

554

555

def renamed(self, node):

555

def renamed(self, node):

556

return storageutil.filerevisioncopied(self, node)

556

return storageutil.filerevisioncopied(self, node)

557

558

def cmp(self, node, fulltext):

558

def cmp(self, node, fulltext):

559

return not storageutil.filedataequivalent(self, node, fulltext)

559

return not storageutil.filedataequivalent(self, node, fulltext)

560

561

def emitrevisions(self, nodes, nodesorder=None, revisiondata=False,

561

def emitrevisions(self, nodes, nodesorder=None, revisiondata=False,

562

assumehaveparentrevisions=False, ~~deltaprevious~~=~~False~~):

562

assumehaveparentrevisions=False,

563

deltamode=repository.CG_DELTAMODE_STD):

563

if nodesorder not in ('nodes', 'storage', None):

564

if nodesorder not in ('nodes', 'storage', None):

564

raise error.ProgrammingError('unhandled value for nodesorder: %s' %

565

raise error.ProgrammingError('unhandled value for nodesorder: %s' %

565

nodesorder)

566

nodesorder)

566

567

nodes = [n for n in nodes if n != nullid]

568

nodes = [n for n in nodes if n != nullid]

568

569

if not nodes:

570

if not nodes:

570

return

571

return

571

572

# TODO perform in a single query.

573

# TODO perform in a single query.

573

res = self._db.execute(

574

res = self._db.execute(

574

r'SELECT revnum, deltaid FROM fileindex '

575

r'SELECT revnum, deltaid FROM fileindex '

575

r'WHERE pathid=? '

576

r'WHERE pathid=? '

576

r' AND node in (%s)' % (r','.join([r'?'] * len(nodes))),

577

r' AND node in (%s)' % (r','.join([r'?'] * len(nodes))),

577

tuple([self._pathid] + nodes))

578

tuple([self._pathid] + nodes))

578

579

deltabases = {}

580

deltabases = {}

580

581

for rev, deltaid in res:

582

for rev, deltaid in res:

582

res = self._db.execute(

583

res = self._db.execute(

583

r'SELECT revnum from fileindex WHERE pathid=? AND deltaid=?',

584

r'SELECT revnum from fileindex WHERE pathid=? AND deltaid=?',

584

(self._pathid, deltaid))

585

(self._pathid, deltaid))

585

deltabases[rev] = res.fetchone()[0]

586

deltabases[rev] = res.fetchone()[0]

586

587

# TODO define revdifffn so we can use delta from storage.

588

# TODO define revdifffn so we can use delta from storage.

588

for delta in storageutil.emitrevisions(

589

for delta in storageutil.emitrevisions(

589

self, nodes, nodesorder, sqliterevisiondelta,

590

self, nodes, nodesorder, sqliterevisiondelta,

590

deltaparentfn=deltabases.__getitem__,

591

deltaparentfn=deltabases.__getitem__,

591

revisiondata=revisiondata,

592

revisiondata=revisiondata,

592

assumehaveparentrevisions=assumehaveparentrevisions,

593

assumehaveparentrevisions=assumehaveparentrevisions,

593

delta~~previous~~=delta~~previous~~):

594

deltamode=deltamode):

594

595

yield delta

596

yield delta

596

597

# End of ifiledata interface.

598

# End of ifiledata interface.

598

599

# Start of ifilemutation interface.

600

# Start of ifilemutation interface.

600

601

def add(self, filedata, meta, transaction, linkrev, p1, p2):

602

def add(self, filedata, meta, transaction, linkrev, p1, p2):

602

if meta or filedata.startswith(b'\x01\n'):

603

if meta or filedata.startswith(b'\x01\n'):

603

filedata = storageutil.packmeta(meta, filedata)

604

filedata = storageutil.packmeta(meta, filedata)

604

605

return self.addrevision(filedata, transaction, linkrev, p1, p2)

606

return self.addrevision(filedata, transaction, linkrev, p1, p2)

606

607

def addrevision(self, revisiondata, transaction, linkrev, p1, p2, node=None,

608

def addrevision(self, revisiondata, transaction, linkrev, p1, p2, node=None,

608

flags=0, cachedelta=None):

609

flags=0, cachedelta=None):

609

if flags:

610

if flags:

610

raise SQLiteStoreError(_('flags not supported on revisions'))

611

raise SQLiteStoreError(_('flags not supported on revisions'))

611

612

validatehash = node is not None

613

validatehash = node is not None

613

node = node or storageutil.hashrevisionsha1(revisiondata, p1, p2)

614

node = node or storageutil.hashrevisionsha1(revisiondata, p1, p2)

614

615

if validatehash:

616

if validatehash:

616

self._checkhash(revisiondata, node, p1, p2)

617

self._checkhash(revisiondata, node, p1, p2)

617

618

if node in self._nodetorev:

619

if node in self._nodetorev:

619

return node

620

return node

620

621

node = self._addrawrevision(node, revisiondata, transaction, linkrev,

622

node = self._addrawrevision(node, revisiondata, transaction, linkrev,

622

p1, p2)

623

p1, p2)

623

624

self._revisioncache[node] = revisiondata

625

self._revisioncache[node] = revisiondata

625

return node

626

return node

626

627

def addgroup(self, deltas, linkmapper, transaction, addrevisioncb=None,

628

def addgroup(self, deltas, linkmapper, transaction, addrevisioncb=None,

628

maybemissingparents=False):

629

maybemissingparents=False):

629

nodes = []

630

nodes = []

630

631

for node, p1, p2, linknode, deltabase, delta, wireflags in deltas:

632

for node, p1, p2, linknode, deltabase, delta, wireflags in deltas:

632

storeflags = 0

633

storeflags = 0

633

634

if wireflags & repository.REVISION_FLAG_CENSORED:

635

if wireflags & repository.REVISION_FLAG_CENSORED:

635

storeflags |= FLAG_CENSORED

636

storeflags |= FLAG_CENSORED

636

637

if wireflags & ~repository.REVISION_FLAG_CENSORED:

638

if wireflags & ~repository.REVISION_FLAG_CENSORED:

638

raise SQLiteStoreError('unhandled revision flag')

639

raise SQLiteStoreError('unhandled revision flag')

639

640

if maybemissingparents:

641

if maybemissingparents:

641

if p1 != nullid and not self.hasnode(p1):

642

if p1 != nullid and not self.hasnode(p1):

642

p1 = nullid

643

p1 = nullid

643

storeflags |= FLAG_MISSING_P1

644

storeflags |= FLAG_MISSING_P1

644

645

if p2 != nullid and not self.hasnode(p2):

646

if p2 != nullid and not self.hasnode(p2):

646

p2 = nullid

647

p2 = nullid

647

storeflags |= FLAG_MISSING_P2

648

storeflags |= FLAG_MISSING_P2

648

649

baserev = self.rev(deltabase)

650

baserev = self.rev(deltabase)

650

651

# If base is censored, delta must be full replacement in a single

652

# If base is censored, delta must be full replacement in a single

652

# patch operation.

653

# patch operation.

653

if baserev != nullrev and self.iscensored(baserev):

654

if baserev != nullrev and self.iscensored(baserev):

654

hlen = struct.calcsize('>lll')

655

hlen = struct.calcsize('>lll')

655

oldlen = len(self.revision(deltabase, raw=True,

656

oldlen = len(self.revision(deltabase, raw=True,

656

_verifyhash=False))

657

_verifyhash=False))

657

newlen = len(delta) - hlen

658

newlen = len(delta) - hlen

658

659

if delta[:hlen] != mdiff.replacediffheader(oldlen, newlen):

660

if delta[:hlen] != mdiff.replacediffheader(oldlen, newlen):

660

raise error.CensoredBaseError(self._path,

661

raise error.CensoredBaseError(self._path,

661

deltabase)

662

deltabase)

662

663

if (not (storeflags & FLAG_CENSORED)

664

if (not (storeflags & FLAG_CENSORED)

664

and storageutil.deltaiscensored(

665

and storageutil.deltaiscensored(

665

delta, baserev, lambda x: len(self.revision(x, raw=True)))):

666

delta, baserev, lambda x: len(self.revision(x, raw=True)))):

666

storeflags |= FLAG_CENSORED

667

storeflags |= FLAG_CENSORED

667

668

linkrev = linkmapper(linknode)

669

linkrev = linkmapper(linknode)

669

670

nodes.append(node)

671

nodes.append(node)

671

672

if node in self._revisions:

673

if node in self._revisions:

673

# Possibly reset parents to make them proper.

674

# Possibly reset parents to make them proper.

674

entry = self._revisions[node]

675

entry = self._revisions[node]

675

676

if entry.flags & FLAG_MISSING_P1 and p1 != nullid:

677

if entry.flags & FLAG_MISSING_P1 and p1 != nullid:

677

entry.p1node = p1

678

entry.p1node = p1

678

entry.p1rev = self._nodetorev[p1]

679

entry.p1rev = self._nodetorev[p1]

679

entry.flags &= ~FLAG_MISSING_P1

680

entry.flags &= ~FLAG_MISSING_P1

680

681

self._db.execute(

682

self._db.execute(

682

r'UPDATE fileindex SET p1rev=?, flags=? '

683

r'UPDATE fileindex SET p1rev=?, flags=? '

683

r'WHERE id=?',

684

r'WHERE id=?',

684

(self._nodetorev[p1], entry.flags, entry.rid))

685

(self._nodetorev[p1], entry.flags, entry.rid))

685

686

if entry.flags & FLAG_MISSING_P2 and p2 != nullid:

687

if entry.flags & FLAG_MISSING_P2 and p2 != nullid:

687

entry.p2node = p2

688

entry.p2node = p2

688

entry.p2rev = self._nodetorev[p2]

689

entry.p2rev = self._nodetorev[p2]

689

entry.flags &= ~FLAG_MISSING_P2

690

entry.flags &= ~FLAG_MISSING_P2

690

691

self._db.execute(

692

self._db.execute(

692

r'UPDATE fileindex SET p2rev=?, flags=? '

693

r'UPDATE fileindex SET p2rev=?, flags=? '

693

r'WHERE id=?',

694

r'WHERE id=?',

694

(self._nodetorev[p1], entry.flags, entry.rid))

695

(self._nodetorev[p1], entry.flags, entry.rid))

695

696

continue

697

continue

697

698

if deltabase == nullid:

699

if deltabase == nullid:

699

text = mdiff.patch(b'', delta)

700

text = mdiff.patch(b'', delta)

700

storedelta = None

701

storedelta = None

701

else:

702

else:

702

text = None

703

text = None

703

storedelta = (deltabase, delta)

704

storedelta = (deltabase, delta)

704

705

self._addrawrevision(node, text, transaction, linkrev, p1, p2,

706

self._addrawrevision(node, text, transaction, linkrev, p1, p2,

706

storedelta=storedelta, flags=storeflags)

707

storedelta=storedelta, flags=storeflags)

707

708

if addrevisioncb:

709

if addrevisioncb:

709

addrevisioncb(self, node)

710

addrevisioncb(self, node)

710

711

return nodes

712

return nodes

712

713

def censorrevision(self, tr, censornode, tombstone=b''):

714

def censorrevision(self, tr, censornode, tombstone=b''):

714

tombstone = storageutil.packmeta({b'censored': tombstone}, b'')

715

tombstone = storageutil.packmeta({b'censored': tombstone}, b'')

715

716

# This restriction is cargo culted from revlogs and makes no sense for

717

# This restriction is cargo culted from revlogs and makes no sense for

717

# SQLite, since columns can be resized at will.

718

# SQLite, since columns can be resized at will.

718

if len(tombstone) > len(self.revision(censornode, raw=True)):

719

if len(tombstone) > len(self.revision(censornode, raw=True)):

719

raise error.Abort(_('censor tombstone must be no longer than '

720

raise error.Abort(_('censor tombstone must be no longer than '

720

'censored data'))

721

'censored data'))

721

722

# We need to replace the censored revision's data with the tombstone.

723

# We need to replace the censored revision's data with the tombstone.

723

# But replacing that data will have implications for delta chains that

724

# But replacing that data will have implications for delta chains that

724

# reference it.

725

# reference it.

725

#

726

#

726

# While "better," more complex strategies are possible, we do something

727

# While "better," more complex strategies are possible, we do something

727

# simple: we find delta chain children of the censored revision and we

728

# simple: we find delta chain children of the censored revision and we

728

# replace those incremental deltas with fulltexts of their corresponding

729

# replace those incremental deltas with fulltexts of their corresponding

729

# revision. Then we delete the now-unreferenced delta and original

730

# revision. Then we delete the now-unreferenced delta and original

730

# revision and insert a replacement.

731

# revision and insert a replacement.

731

732

# Find the delta to be censored.

733

# Find the delta to be censored.

733

censoreddeltaid = self._db.execute(

734

censoreddeltaid = self._db.execute(

734

r'SELECT deltaid FROM fileindex WHERE id=?',

735

r'SELECT deltaid FROM fileindex WHERE id=?',

735

(self._revisions[censornode].rid,)).fetchone()[0]

736

(self._revisions[censornode].rid,)).fetchone()[0]

736

737

# Find all its delta chain children.

738

# Find all its delta chain children.

738

# TODO once we support storing deltas for !files, we'll need to look

739

# TODO once we support storing deltas for !files, we'll need to look

739

# for those delta chains too.

740

# for those delta chains too.

740

rows = list(self._db.execute(

741

rows = list(self._db.execute(

741

r'SELECT id, pathid, node FROM fileindex '

742

r'SELECT id, pathid, node FROM fileindex '

742

r'WHERE deltabaseid=? OR deltaid=?',

743

r'WHERE deltabaseid=? OR deltaid=?',

743

(censoreddeltaid, censoreddeltaid)))

744

(censoreddeltaid, censoreddeltaid)))

744

745

for row in rows:

746

for row in rows:

746

rid, pathid, node = row

747

rid, pathid, node = row

747

748

fulltext = resolvedeltachain(self._db, pathid, node, {}, {-1: None},

749

fulltext = resolvedeltachain(self._db, pathid, node, {}, {-1: None},

749

zstddctx=self._dctx)

750

zstddctx=self._dctx)

750

751

deltahash = hashlib.sha1(fulltext).digest()

752

deltahash = hashlib.sha1(fulltext).digest()

752

753

if self._compengine == 'zstd':

754

if self._compengine == 'zstd':

754

deltablob = self._cctx.compress(fulltext)

755

deltablob = self._cctx.compress(fulltext)

755

compression = COMPRESSION_ZSTD

756

compression = COMPRESSION_ZSTD

756

elif self._compengine == 'zlib':

757

elif self._compengine == 'zlib':

757

deltablob = zlib.compress(fulltext)

758

deltablob = zlib.compress(fulltext)

758

compression = COMPRESSION_ZLIB

759

compression = COMPRESSION_ZLIB

759

elif self._compengine == 'none':

760

elif self._compengine == 'none':

760

deltablob = fulltext

761

deltablob = fulltext

761

compression = COMPRESSION_NONE

762

compression = COMPRESSION_NONE

762

else:

763

else:

763

raise error.ProgrammingError('unhandled compression engine: %s'

764

raise error.ProgrammingError('unhandled compression engine: %s'

764

% self._compengine)

765

% self._compengine)

765

766

if len(deltablob) >= len(fulltext):

767

if len(deltablob) >= len(fulltext):

767

deltablob = fulltext

768

deltablob = fulltext

768

compression = COMPRESSION_NONE

769

compression = COMPRESSION_NONE

769

770

deltaid = insertdelta(self._db, compression, deltahash, deltablob)

771

deltaid = insertdelta(self._db, compression, deltahash, deltablob)

771

772

self._db.execute(

773

self._db.execute(

773

r'UPDATE fileindex SET deltaid=?, deltabaseid=NULL '

774

r'UPDATE fileindex SET deltaid=?, deltabaseid=NULL '

774

r'WHERE id=?', (deltaid, rid))

775

r'WHERE id=?', (deltaid, rid))

775

776

# Now create the tombstone delta and replace the delta on the censored

777

# Now create the tombstone delta and replace the delta on the censored

777

# node.

778

# node.

778

deltahash = hashlib.sha1(tombstone).digest()

779

deltahash = hashlib.sha1(tombstone).digest()

779

tombstonedeltaid = insertdelta(self._db, COMPRESSION_NONE,

780

tombstonedeltaid = insertdelta(self._db, COMPRESSION_NONE,

780

deltahash, tombstone)

781

deltahash, tombstone)

781

782

flags = self._revisions[censornode].flags

783

flags = self._revisions[censornode].flags

783

flags |= FLAG_CENSORED

784

flags |= FLAG_CENSORED

784

785

self._db.execute(

786

self._db.execute(

786

r'UPDATE fileindex SET flags=?, deltaid=?, deltabaseid=NULL '

787

r'UPDATE fileindex SET flags=?, deltaid=?, deltabaseid=NULL '

787

r'WHERE pathid=? AND node=?',

788

r'WHERE pathid=? AND node=?',

788

(flags, tombstonedeltaid, self._pathid, censornode))

789

(flags, tombstonedeltaid, self._pathid, censornode))

789

790

self._db.execute(

791

self._db.execute(

791

r'DELETE FROM delta WHERE id=?', (censoreddeltaid,))

792

r'DELETE FROM delta WHERE id=?', (censoreddeltaid,))

792

793

self._refreshindex()

794

self._refreshindex()

794

self._revisioncache.clear()

795

self._revisioncache.clear()

795

796

def getstrippoint(self, minlink):

797

def getstrippoint(self, minlink):

797

return storageutil.resolvestripinfo(minlink, len(self) - 1,

798

return storageutil.resolvestripinfo(minlink, len(self) - 1,

798

[self.rev(n) for n in self.heads()],

799

[self.rev(n) for n in self.heads()],

799

self.linkrev,

800

self.linkrev,

800

self.parentrevs)

801

self.parentrevs)

801

802

def strip(self, minlink, transaction):

803

def strip(self, minlink, transaction):

803

if not len(self):

804

if not len(self):

804

return

805

return

805

806

rev, _ignored = self.getstrippoint(minlink)

807

rev, _ignored = self.getstrippoint(minlink)

807

808

if rev == len(self):

809

if rev == len(self):

809

return

810

return

810

811

for rev in self.revs(rev):

812

for rev in self.revs(rev):

812

self._db.execute(

813

self._db.execute(

813

r'DELETE FROM fileindex WHERE pathid=? AND node=?',

814

r'DELETE FROM fileindex WHERE pathid=? AND node=?',

814

(self._pathid, self.node(rev)))

815

(self._pathid, self.node(rev)))

815

816

# TODO how should we garbage collect data in delta table?

817

# TODO how should we garbage collect data in delta table?

817

818

self._refreshindex()

819

self._refreshindex()

819

820

# End of ifilemutation interface.

821

# End of ifilemutation interface.

821

822

# Start of ifilestorage interface.

823

# Start of ifilestorage interface.

823

824

def files(self):

825

def files(self):

825

return []

826

return []

826

827

def storageinfo(self, exclusivefiles=False, sharedfiles=False,

828

def storageinfo(self, exclusivefiles=False, sharedfiles=False,

828

revisionscount=False, trackedsize=False,

829

revisionscount=False, trackedsize=False,

829

storedsize=False):

830

storedsize=False):

830

d = {}

831

d = {}

831

832

if exclusivefiles:

833

if exclusivefiles:

833

d['exclusivefiles'] = []

834

d['exclusivefiles'] = []

834

835

if sharedfiles:

836

if sharedfiles:

836

# TODO list sqlite file(s) here.

837

# TODO list sqlite file(s) here.

837

d['sharedfiles'] = []

838

d['sharedfiles'] = []

838

839

if revisionscount:

840

if revisionscount:

840

d['revisionscount'] = len(self)

841

d['revisionscount'] = len(self)

841

842

if trackedsize:

843

if trackedsize:

843

d['trackedsize'] = sum(len(self.revision(node))

844

d['trackedsize'] = sum(len(self.revision(node))

844

for node in self._nodetorev)

845

for node in self._nodetorev)

845

846

if storedsize:

847

if storedsize:

847

# TODO implement this?

848

# TODO implement this?

848

d['storedsize'] = None

849

d['storedsize'] = None

849

850

return d

851

return d

851

852

def verifyintegrity(self, state):

853

def verifyintegrity(self, state):

853

state['skipread'] = set()

854

state['skipread'] = set()

854

855

for rev in self:

856

for rev in self:

856

node = self.node(rev)

857

node = self.node(rev)

857

858

try:

859

try:

859

self.revision(node)

860

self.revision(node)

860

except Exception as e:

861

except Exception as e:

861

yield sqliteproblem(

862

yield sqliteproblem(

862

error=_('unpacking %s: %s') % (short(node), e),

863

error=_('unpacking %s: %s') % (short(node), e),

863

node=node)

864

node=node)

864

865

state['skipread'].add(node)

866

state['skipread'].add(node)

866

867

# End of ifilestorage interface.

868

# End of ifilestorage interface.

868

869

def _checkhash(self, fulltext, node, p1=None, p2=None):

870

def _checkhash(self, fulltext, node, p1=None, p2=None):

870

if p1 is None and p2 is None:

871

if p1 is None and p2 is None:

871

p1, p2 = self.parents(node)

872

p1, p2 = self.parents(node)

872

873

if node == storageutil.hashrevisionsha1(fulltext, p1, p2):

874

if node == storageutil.hashrevisionsha1(fulltext, p1, p2):

874

return

875

return

875

876

try:

877

try:

877

del self._revisioncache[node]

878

del self._revisioncache[node]

878

except KeyError:

879

except KeyError:

879

pass

880

pass

880

881

if storageutil.iscensoredtext(fulltext):

882

if storageutil.iscensoredtext(fulltext):

882

raise error.CensoredNodeError(self._path, node, fulltext)

883

raise error.CensoredNodeError(self._path, node, fulltext)

883

884

raise SQLiteStoreError(_('integrity check failed on %s') %

885

raise SQLiteStoreError(_('integrity check failed on %s') %

885

self._path)

886

self._path)

886

887

def _addrawrevision(self, node, revisiondata, transaction, linkrev,

888

def _addrawrevision(self, node, revisiondata, transaction, linkrev,

888

p1, p2, storedelta=None, flags=0):

889

p1, p2, storedelta=None, flags=0):

889

if self._pathid is None:

890

if self._pathid is None:

890

res = self._db.execute(

891

res = self._db.execute(

891

r'INSERT INTO filepath (path) VALUES (?)', (self._path,))

892

r'INSERT INTO filepath (path) VALUES (?)', (self._path,))

892

self._pathid = res.lastrowid

893

self._pathid = res.lastrowid

893

894

# For simplicity, always store a delta against p1.

895

# For simplicity, always store a delta against p1.

895

# TODO we need a lot more logic here to make behavior reasonable.

896

# TODO we need a lot more logic here to make behavior reasonable.

896

897

if storedelta:

898

if storedelta:

898

deltabase, delta = storedelta

899

deltabase, delta = storedelta

899

900

if isinstance(deltabase, int):

901

if isinstance(deltabase, int):

901

deltabase = self.node(deltabase)

902

deltabase = self.node(deltabase)

902

903

else:

904

else:

904

assert revisiondata is not None

905

assert revisiondata is not None

905

deltabase = p1

906

deltabase = p1

906

907

if deltabase == nullid:

908

if deltabase == nullid:

908

delta = revisiondata

909

delta = revisiondata

909

else:

910

else:

910

delta = mdiff.textdiff(self.revision(self.rev(deltabase)),

911

delta = mdiff.textdiff(self.revision(self.rev(deltabase)),

911

revisiondata)

912

revisiondata)

912

913

# File index stores a pointer to its delta and the parent delta.

914

# File index stores a pointer to its delta and the parent delta.

914

# The parent delta is stored via a pointer to the fileindex PK.

915

# The parent delta is stored via a pointer to the fileindex PK.

915

if deltabase == nullid:

916

if deltabase == nullid:

916

baseid = None

917

baseid = None

917

else:

918

else:

918

baseid = self._revisions[deltabase].rid

919

baseid = self._revisions[deltabase].rid

919

920

# Deltas are stored with a hash of their content. This allows

921

# Deltas are stored with a hash of their content. This allows

921

# us to de-duplicate. The table is configured to ignore conflicts

922

# us to de-duplicate. The table is configured to ignore conflicts

922

# and it is faster to just insert and silently noop than to look

923

# and it is faster to just insert and silently noop than to look

923

# first.

924

# first.

924

deltahash = hashlib.sha1(delta).digest()

925

deltahash = hashlib.sha1(delta).digest()

925

926

if self._compengine == 'zstd':

927

if self._compengine == 'zstd':

927

deltablob = self._cctx.compress(delta)

928

deltablob = self._cctx.compress(delta)

928

compression = COMPRESSION_ZSTD

929

compression = COMPRESSION_ZSTD

929

elif self._compengine == 'zlib':

930

elif self._compengine == 'zlib':

930

deltablob = zlib.compress(delta)

931

deltablob = zlib.compress(delta)

931

compression = COMPRESSION_ZLIB

932

compression = COMPRESSION_ZLIB

932

elif self._compengine == 'none':

933

elif self._compengine == 'none':

933

deltablob = delta

934

deltablob = delta

934

compression = COMPRESSION_NONE

935

compression = COMPRESSION_NONE

935

else:

936

else:

936

raise error.ProgrammingError('unhandled compression engine: %s' %

937

raise error.ProgrammingError('unhandled compression engine: %s' %

937

self._compengine)

938

self._compengine)

938

939

# Don't store compressed data if it isn't practical.

940

# Don't store compressed data if it isn't practical.

940

if len(deltablob) >= len(delta):

941

if len(deltablob) >= len(delta):

941

deltablob = delta

942

deltablob = delta

942

compression = COMPRESSION_NONE

943

compression = COMPRESSION_NONE

943

944

deltaid = insertdelta(self._db, compression, deltahash, deltablob)

945

deltaid = insertdelta(self._db, compression, deltahash, deltablob)

945

946

rev = len(self)

947

rev = len(self)

947

948

if p1 == nullid:

949

if p1 == nullid:

949

p1rev = nullrev

950

p1rev = nullrev

950

else:

951

else:

951

p1rev = self._nodetorev[p1]

952

p1rev = self._nodetorev[p1]

952

953

if p2 == nullid:

954

if p2 == nullid:

954

p2rev = nullrev

955

p2rev = nullrev

955

else:

956

else:

956

p2rev = self._nodetorev[p2]

957

p2rev = self._nodetorev[p2]

957

958

rid = self._db.execute(

959

rid = self._db.execute(

959

r'INSERT INTO fileindex ('

960

r'INSERT INTO fileindex ('

960

r' pathid, revnum, node, p1rev, p2rev, linkrev, flags, '

961

r' pathid, revnum, node, p1rev, p2rev, linkrev, flags, '

961

r' deltaid, deltabaseid) '

962

r' deltaid, deltabaseid) '

962

r' VALUES (?, ?, ?, ?, ?, ?, ?, ?, ?)',

963

r' VALUES (?, ?, ?, ?, ?, ?, ?, ?, ?)',

963

(self._pathid, rev, node, p1rev, p2rev, linkrev, flags,

964

(self._pathid, rev, node, p1rev, p2rev, linkrev, flags,

964

deltaid, baseid)

965

deltaid, baseid)

965

).lastrowid

966

).lastrowid

966

967

entry = revisionentry(

968

entry = revisionentry(

968

rid=rid,

969

rid=rid,

969

rev=rev,

970

rev=rev,

970

node=node,

971

node=node,

971

p1rev=p1rev,

972

p1rev=p1rev,

972

p2rev=p2rev,

973

p2rev=p2rev,

973

p1node=p1,

974

p1node=p1,

974

p2node=p2,

975

p2node=p2,

975

linkrev=linkrev,

976

linkrev=linkrev,

976

flags=flags)

977

flags=flags)

977

978

self._nodetorev[node] = rev

979

self._nodetorev[node] = rev

979

self._revtonode[rev] = node

980

self._revtonode[rev] = node

980

self._revisions[node] = entry

981

self._revisions[node] = entry

981

982

return node

983

return node

983

984

class sqliterepository(localrepo.localrepository):

985

class sqliterepository(localrepo.localrepository):

985

def cancopy(self):

986

def cancopy(self):

986

return False

987

return False

987

988

def transaction(self, *args, **kwargs):

989

def transaction(self, *args, **kwargs):

989

current = self.currenttransaction()

990

current = self.currenttransaction()

990

991

tr = super(sqliterepository, self).transaction(*args, **kwargs)

992

tr = super(sqliterepository, self).transaction(*args, **kwargs)

992

993

if current:

994

if current:

994

return tr

995

return tr

995

996

self._dbconn.execute(r'BEGIN TRANSACTION')

997

self._dbconn.execute(r'BEGIN TRANSACTION')

997

998

def committransaction(_):

999

def committransaction(_):

999

self._dbconn.commit()

1000

self._dbconn.commit()

1000

1001

tr.addfinalize('sqlitestore', committransaction)

1002

tr.addfinalize('sqlitestore', committransaction)

1002

1003

return tr

1004

return tr

1004

1005

@property

1006

@property

1006

def _dbconn(self):

1007

def _dbconn(self):

1007

# SQLite connections can only be used on the thread that created

1008

# SQLite connections can only be used on the thread that created

1008

# them. In most cases, this "just works." However, hgweb uses

1009

# them. In most cases, this "just works." However, hgweb uses

1009

# multiple threads.

1010

# multiple threads.

1010

tid = threading.current_thread().ident

1011

tid = threading.current_thread().ident

1011

1012

if self._db:

1013

if self._db:

1013

if self._db[0] == tid:

1014

if self._db[0] == tid:

1014

return self._db[1]

1015

return self._db[1]

1015

1016

db = makedb(self.svfs.join('db.sqlite'))

1017

db = makedb(self.svfs.join('db.sqlite'))

1017

self._db = (tid, db)

1018

self._db = (tid, db)

1018

1019

return db

1020

return db

1020

1021

def makedb(path):

1022

def makedb(path):

1022

"""Construct a database handle for a database at path."""

1023

"""Construct a database handle for a database at path."""

1023

1024

db = sqlite3.connect(encoding.strfromlocal(path))

1025

db = sqlite3.connect(encoding.strfromlocal(path))

1025

db.text_factory = bytes

1026

db.text_factory = bytes

1026

1027

res = db.execute(r'PRAGMA user_version').fetchone()[0]

1028

res = db.execute(r'PRAGMA user_version').fetchone()[0]

1028

1029

# New database.

1030

# New database.

1030

if res == 0:

1031

if res == 0:

1031

for statement in CREATE_SCHEMA:

1032

for statement in CREATE_SCHEMA:

1032

db.execute(statement)

1033

db.execute(statement)

1033

1034

db.commit()

1035

db.commit()

1035

1036

elif res == CURRENT_SCHEMA_VERSION:

1037

elif res == CURRENT_SCHEMA_VERSION:

1037

pass

1038

pass

1038

1039

else:

1040

else:

1040

raise error.Abort(_('sqlite database has unrecognized version'))

1041

raise error.Abort(_('sqlite database has unrecognized version'))

1041

1042

db.execute(r'PRAGMA journal_mode=WAL')

1043

db.execute(r'PRAGMA journal_mode=WAL')

1043

1044

return db

1045

return db

1045

1046

def featuresetup(ui, supported):

1047

def featuresetup(ui, supported):

1047

supported.add(REQUIREMENT)

1048

supported.add(REQUIREMENT)

1048

1049

if zstd:

1050

if zstd:

1050

supported.add(REQUIREMENT_ZSTD)

1051

supported.add(REQUIREMENT_ZSTD)

1051

1052

supported.add(REQUIREMENT_ZLIB)

1053

supported.add(REQUIREMENT_ZLIB)

1053

supported.add(REQUIREMENT_NONE)

1054

supported.add(REQUIREMENT_NONE)

1054

supported.add(REQUIREMENT_SHALLOW_FILES)

1055

supported.add(REQUIREMENT_SHALLOW_FILES)

1055

supported.add(repository.NARROW_REQUIREMENT)

1056

supported.add(repository.NARROW_REQUIREMENT)

1056

1057

def newreporequirements(orig, ui, createopts):

1058

def newreporequirements(orig, ui, createopts):

1058

if createopts['backend'] != 'sqlite':

1059

if createopts['backend'] != 'sqlite':

1059

return orig(ui, createopts)

1060

return orig(ui, createopts)

1060

1061

# This restriction can be lifted once we have more confidence.

1062

# This restriction can be lifted once we have more confidence.

1062

if 'sharedrepo' in createopts:

1063

if 'sharedrepo' in createopts:

1063

raise error.Abort(_('shared repositories not supported with SQLite '

1064

raise error.Abort(_('shared repositories not supported with SQLite '

1064

'store'))

1065

'store'))

1065

1066

# This filtering is out of an abundance of caution: we want to ensure

1067

# This filtering is out of an abundance of caution: we want to ensure

1067

# we honor creation options and we do that by annotating exactly the

1068

# we honor creation options and we do that by annotating exactly the

1068

# creation options we recognize.

1069

# creation options we recognize.

1069

known = {

1070

known = {

1070

'narrowfiles',

1071

'narrowfiles',

1071

'backend',

1072

'backend',

1072

'shallowfilestore',

1073

'shallowfilestore',

1073

}

1074

}

1074

1075

unsupported = set(createopts) - known

1076

unsupported = set(createopts) - known

1076

if unsupported:

1077

if unsupported:

1077

raise error.Abort(_('SQLite store does not support repo creation '

1078

raise error.Abort(_('SQLite store does not support repo creation '

1078

'option: %s') % ', '.join(sorted(unsupported)))

1079

'option: %s') % ', '.join(sorted(unsupported)))

1079

1080

# Since we're a hybrid store that still relies on revlogs, we fall back

1081

# Since we're a hybrid store that still relies on revlogs, we fall back

1081

# to using the revlogv1 backend's storage requirements then adding our

1082

# to using the revlogv1 backend's storage requirements then adding our

1082

# own requirement.

1083

# own requirement.

1083

createopts['backend'] = 'revlogv1'

1084

createopts['backend'] = 'revlogv1'

1084

requirements = orig(ui, createopts)

1085

requirements = orig(ui, createopts)

1085

requirements.add(REQUIREMENT)

1086

requirements.add(REQUIREMENT)

1086

1087

compression = ui.config('storage', 'sqlite.compression')

1088

compression = ui.config('storage', 'sqlite.compression')

1088

1089

if compression == 'zstd' and not zstd:

1090

if compression == 'zstd' and not zstd:

1090

raise error.Abort(_('storage.sqlite.compression set to "zstd" but '

1091

raise error.Abort(_('storage.sqlite.compression set to "zstd" but '

1091

'zstandard compression not available to this '

1092

'zstandard compression not available to this '

1092

'Mercurial install'))

1093

'Mercurial install'))

1093

1094

if compression == 'zstd':

1095

if compression == 'zstd':

1095

requirements.add(REQUIREMENT_ZSTD)

1096

requirements.add(REQUIREMENT_ZSTD)

1096

elif compression == 'zlib':

1097

elif compression == 'zlib':

1097

requirements.add(REQUIREMENT_ZLIB)

1098

requirements.add(REQUIREMENT_ZLIB)

1098

elif compression == 'none':

1099

elif compression == 'none':

1099

requirements.add(REQUIREMENT_NONE)

1100

requirements.add(REQUIREMENT_NONE)

1100

else:

1101

else:

1101

raise error.Abort(_('unknown compression engine defined in '

1102

raise error.Abort(_('unknown compression engine defined in '

1102

'storage.sqlite.compression: %s') % compression)

1103

'storage.sqlite.compression: %s') % compression)

1103

1104

if createopts.get('shallowfilestore'):

1105

if createopts.get('shallowfilestore'):

1105

requirements.add(REQUIREMENT_SHALLOW_FILES)

1106

requirements.add(REQUIREMENT_SHALLOW_FILES)

1106

1107

return requirements

1108

return requirements

1108

1109

@interfaceutil.implementer(repository.ilocalrepositoryfilestorage)

1110

@interfaceutil.implementer(repository.ilocalrepositoryfilestorage)

1110

class sqlitefilestorage(object):

1111

class sqlitefilestorage(object):

1111

"""Repository file storage backed by SQLite."""

1112

"""Repository file storage backed by SQLite."""

1112

def file(self, path):

1113

def file(self, path):

1113

if path[0] == b'/':

1114

if path[0] == b'/':

1114

path = path[1:]

1115

path = path[1:]

1115

1116

if REQUIREMENT_ZSTD in self.requirements:

1117

if REQUIREMENT_ZSTD in self.requirements:

1117

compression = 'zstd'

1118

compression = 'zstd'

1118

elif REQUIREMENT_ZLIB in self.requirements:

1119

elif REQUIREMENT_ZLIB in self.requirements:

1119

compression = 'zlib'

1120

compression = 'zlib'

1120

elif REQUIREMENT_NONE in self.requirements:

1121

elif REQUIREMENT_NONE in self.requirements:

1121

compression = 'none'

1122

compression = 'none'

1122

else:

1123

else:

1123

raise error.Abort(_('unable to determine what compression engine '

1124

raise error.Abort(_('unable to determine what compression engine '

1124

'to use for SQLite storage'))

1125

'to use for SQLite storage'))

1125

1126

return sqlitefilestore(self._dbconn, path, compression)

1127

return sqlitefilestore(self._dbconn, path, compression)

1127

1128

def makefilestorage(orig, requirements, features, **kwargs):

1129

def makefilestorage(orig, requirements, features, **kwargs):

1129

"""Produce a type conforming to ``ilocalrepositoryfilestorage``."""

1130

"""Produce a type conforming to ``ilocalrepositoryfilestorage``."""

1130

if REQUIREMENT in requirements:

1131

if REQUIREMENT in requirements:

1131

if REQUIREMENT_SHALLOW_FILES in requirements:

1132

if REQUIREMENT_SHALLOW_FILES in requirements:

1132

features.add(repository.REPO_FEATURE_SHALLOW_FILE_STORAGE)

1133

features.add(repository.REPO_FEATURE_SHALLOW_FILE_STORAGE)

1133

1134

return sqlitefilestorage

1135

return sqlitefilestorage

1135

else:

1136

else:

1136

return orig(requirements=requirements, features=features, **kwargs)

1137

return orig(requirements=requirements, features=features, **kwargs)

1137

1138

def makemain(orig, ui, requirements, **kwargs):

1139

def makemain(orig, ui, requirements, **kwargs):

1139

if REQUIREMENT in requirements:

1140

if REQUIREMENT in requirements:

1140

if REQUIREMENT_ZSTD in requirements and not zstd:

1141

if REQUIREMENT_ZSTD in requirements and not zstd:

1141

raise error.Abort(_('repository uses zstandard compression, which '

1142

raise error.Abort(_('repository uses zstandard compression, which '

1142

'is not available to this Mercurial install'))

1143

'is not available to this Mercurial install'))

1143

1144

return sqliterepository

1145

return sqliterepository

1145

1146

return orig(requirements=requirements, **kwargs)

1147

return orig(requirements=requirements, **kwargs)

1147

1148

def verifierinit(orig, self, *args, **kwargs):

1149

def verifierinit(orig, self, *args, **kwargs):

1149

orig(self, *args, **kwargs)

1150

orig(self, *args, **kwargs)

1150

1151

# We don't care that files in the store don't align with what is

1152

# We don't care that files in the store don't align with what is

1152

# advertised. So suppress these warnings.

1153

# advertised. So suppress these warnings.

1153

self.warnorphanstorefiles = False

1154

self.warnorphanstorefiles = False

1154

1155

def extsetup(ui):

1156

def extsetup(ui):

1156

localrepo.featuresetupfuncs.add(featuresetup)

1157

localrepo.featuresetupfuncs.add(featuresetup)

1157

extensions.wrapfunction(localrepo, 'newreporequirements',

1158

extensions.wrapfunction(localrepo, 'newreporequirements',

1158

newreporequirements)

1159

newreporequirements)

1159

extensions.wrapfunction(localrepo, 'makefilestorage',

1160

extensions.wrapfunction(localrepo, 'makefilestorage',

1160

makefilestorage)

1161

makefilestorage)

1161

extensions.wrapfunction(localrepo, 'makemain',

1162

extensions.wrapfunction(localrepo, 'makemain',

1162

makemain)

1163

makemain)

1163

extensions.wrapfunction(verify.verifier, '__init__',

1164

extensions.wrapfunction(verify.verifier, '__init__',

1164

verifierinit)

1165

verifierinit)

1165

1166

def reposetup(ui, repo):

1167

def reposetup(ui, repo):

1167

if isinstance(repo, sqliterepository):

1168

if isinstance(repo, sqliterepository):

1168

repo._db = None

1169

repo._db = None

1169

1170

# TODO check for bundlerepository?

1171

# TODO check for bundlerepository?

	Site-wide shortcuts
/	Use quick search box
g h	Goto home page
g g	Goto my private gists page
g G	Goto my public gists page
g 0-9	Goto bookmarked items from 0-9
n r	New repository page
n g	New gist page

	Repositories
g s	Goto summary page
g c	Goto changelog page
g f	Goto files page
g F	Goto files page with file search activated
g p	Goto pull requests page
g o	Goto repository settings
g O	Goto repository access permissions settings
t s	Toggle sidebar on some pages

             # sqlitestore.py - Storage backend that uses SQLite
             #
             # Copyright 2018 Gregory Szorc <gregory.szorc@gmail.com>
             #
             # This software may be used and distributed according to the terms of the
             # GNU General Public License version 2 or any later version.
             """store repository data in SQLite (EXPERIMENTAL)
             The sqlitestore extension enables the storage of repository data in SQLite.
             This extension is HIGHLY EXPERIMENTAL. There are NO BACKWARDS COMPATIBILITY
             GUARANTEES. This means that repositories created with this extension may
             only be usable with the exact version of this extension/Mercurial that was
             used. The extension attempts to enforce this in order to prevent repository
             corruption.
             In addition, several features are not yet supported or have known bugs:
             * Only some data is stored in SQLite. Changeset, manifest, and other repository
               data is not yet stored in SQLite.
             * Transactions are not robust. If the process is aborted at the right time
               during transaction close/rollback, the repository could be in an inconsistent
               state. This problem will diminish once all repository data is tracked by
               SQLite.
             * Bundle repositories do not work (the ability to use e.g.
               `hg -R <bundle-file> log` to automatically overlay a bundle on top of the
               existing repository).
             * Various other features don't work.
             This extension should work for basic clone/pull, update, and commit workflows.
             Some history rewriting operations may fail due to lack of support for bundle
             repositories.
             To use, activate the extension and set the ``storage.new-repo-backend`` config
             option to ``sqlite`` to enable new repositories to use SQLite for storage.
             """
             # To run the test suite with repos using SQLite by default, execute the
             # following:
             #
             # HGREPOFEATURES="sqlitestore" run-tests.py \
             #     --extra-config-opt extensions.sqlitestore= \
             #     --extra-config-opt storage.new-repo-backend=sqlite
             from __future__ import absolute_import
             import hashlib
             import sqlite3
             import struct
             import threading
             import zlib
             from mercurial.i18n import _
             from mercurial.node import (
                 nullid,
                 nullrev,
                 short,
             )
             from mercurial.thirdparty import (
                 attr,
             )
             from mercurial import (
                 ancestor,
                 dagop,
                 encoding,
                 error,
                 extensions,
                 localrepo,
                 mdiff,
                 pycompat,
                 registrar,
                 repository,
                 util,
                 verify,
             )
             from mercurial.utils import (
                 interfaceutil,
                 storageutil,
             )
             try:
                 from mercurial import zstd
                 zstd.__version__
             except ImportError:
                 zstd = None
             configtable = {}
             configitem = registrar.configitem(configtable)
             # experimental config: storage.sqlite.compression
             configitem('storage', 'sqlite.compression',
                        default='zstd' if zstd else 'zlib')
             # Note for extension authors: ONLY specify testedwith = 'ships-with-hg-core' for
             # extensions which SHIP WITH MERCURIAL. Non-mainline extensions should
             # be specifying the version(s) of Mercurial they are tested with, or
             # leave the attribute unspecified.
             testedwith = 'ships-with-hg-core'
             REQUIREMENT = b'exp-sqlite-001'
             REQUIREMENT_ZSTD = b'exp-sqlite-comp-001=zstd'
             REQUIREMENT_ZLIB = b'exp-sqlite-comp-001=zlib'
             REQUIREMENT_NONE = b'exp-sqlite-comp-001=none'
             REQUIREMENT_SHALLOW_FILES = b'exp-sqlite-shallow-files'
             CURRENT_SCHEMA_VERSION = 1
             COMPRESSION_NONE = 1
             COMPRESSION_ZSTD = 2
             COMPRESSION_ZLIB = 3
             FLAG_CENSORED = 1
             FLAG_MISSING_P1 = 2
             FLAG_MISSING_P2 = 4
             CREATE_SCHEMA = [
                 # Deltas are stored as content-indexed blobs.
                 # compression column holds COMPRESSION_* constant for how the
                 # delta is encoded.
                 r'CREATE TABLE delta ('
                 r'    id INTEGER PRIMARY KEY, '
                 r'    compression INTEGER NOT NULL, '
                 r'    hash BLOB UNIQUE ON CONFLICT ABORT, '
                 r'    delta BLOB NOT NULL '
                 r')',
                 # Tracked paths are denormalized to integers to avoid redundant
                 # storage of the path name.
                 r'CREATE TABLE filepath ('
                 r'    id INTEGER PRIMARY KEY, '
                 r'    path BLOB NOT NULL '
                 r')',
                 r'CREATE UNIQUE INDEX filepath_path '
                 r'    ON filepath (path)',
                 # We have a single table for all file revision data.
                 # Each file revision is uniquely described by a (path, rev) and
                 # (path, node).
                 #
                 # Revision data is stored as a pointer to the delta producing this
                 # revision and the file revision whose delta should be applied before
                 # that one. One can reconstruct the delta chain by recursively following
                 # the delta base revision pointers until one encounters NULL.
                 #
                 # flags column holds bitwise integer flags controlling storage options.
                 # These flags are defined by the FLAG_* constants.
                 r'CREATE TABLE fileindex ('
                 r'    id INTEGER PRIMARY KEY, '
                 r'    pathid INTEGER REFERENCES filepath(id), '
                 r'    revnum INTEGER NOT NULL, '
                 r'    p1rev INTEGER NOT NULL, '
                 r'    p2rev INTEGER NOT NULL, '
                 r'    linkrev INTEGER NOT NULL, '
                 r'    flags INTEGER NOT NULL, '
                 r'    deltaid INTEGER REFERENCES delta(id), '
                 r'    deltabaseid INTEGER REFERENCES fileindex(id), '
                 r'    node BLOB NOT NULL '
                 r')',
                 r'CREATE UNIQUE INDEX fileindex_pathrevnum '
                 r'    ON fileindex (pathid, revnum)',
                 r'CREATE UNIQUE INDEX fileindex_pathnode '
                 r'    ON fileindex (pathid, node)',
                 # Provide a view over all file data for convenience.
                 r'CREATE VIEW filedata AS '
                 r'SELECT '
                 r'    fileindex.id AS id, '
                 r'    filepath.id AS pathid, '
                 r'    filepath.path AS path, '
                 r'    fileindex.revnum AS revnum, '
                 r'    fileindex.node AS node, '
                 r'    fileindex.p1rev AS p1rev, '
                 r'    fileindex.p2rev AS p2rev, '
                 r'    fileindex.linkrev AS linkrev, '
                 r'    fileindex.flags AS flags, '
                 r'    fileindex.deltaid AS deltaid, '
                 r'    fileindex.deltabaseid AS deltabaseid '
                 r'FROM filepath, fileindex '
                 r'WHERE fileindex.pathid=filepath.id',
                 r'PRAGMA user_version=%d' % CURRENT_SCHEMA_VERSION,
             ]
             def resolvedeltachain(db, pathid, node, revisioncache,
                                   stoprids, zstddctx=None):
                 """Resolve a delta chain for a file node."""
                 # TODO the "not in ({stops})" here is possibly slowing down the query
                 # because it needs to perform the lookup on every recursive invocation.
                 # This could possibly be faster if we created a temporary query with
                 # baseid "poisoned" to null and limited the recursive filter to
                 # "is not null".
                 res = db.execute(
                     r'WITH RECURSIVE '
                     r'    deltachain(deltaid, baseid) AS ('
                     r'        SELECT deltaid, deltabaseid FROM fileindex '
                     r'            WHERE pathid=? AND node=? '
                     r'        UNION ALL '
                     r'        SELECT fileindex.deltaid, deltabaseid '
                     r'            FROM fileindex, deltachain '
                     r'            WHERE '
                     r'                fileindex.id=deltachain.baseid '
                     r'                AND deltachain.baseid IS NOT NULL '
                     r'                AND fileindex.id NOT IN ({stops}) '
                     r'    ) '
                     r'SELECT deltachain.baseid, compression, delta '
                     r'FROM deltachain, delta '
                     r'WHERE delta.id=deltachain.deltaid'.format(
                         stops=r','.join([r'?'] * len(stoprids))),
                     tuple([pathid, node] + list(stoprids.keys())))
                 deltas = []
                 lastdeltabaseid = None
                 for deltabaseid, compression, delta in res:
                     lastdeltabaseid = deltabaseid
                     if compression == COMPRESSION_ZSTD:
                         delta = zstddctx.decompress(delta)
                     elif compression == COMPRESSION_NONE:
                         delta = delta
                     elif compression == COMPRESSION_ZLIB:
                         delta = zlib.decompress(delta)
                     else:
                         raise SQLiteStoreError('unhandled compression type: %d' %
                                                compression)
                     deltas.append(delta)
                 if lastdeltabaseid in stoprids:
                     basetext = revisioncache[stoprids[lastdeltabaseid]]
                 else:
                     basetext = deltas.pop()
                 deltas.reverse()
                 fulltext = mdiff.patches(basetext, deltas)
                 # SQLite returns buffer instances for blob columns on Python 2. This
                 # type can propagate through the delta application layer. Because
                 # downstream callers assume revisions are bytes, cast as needed.
                 if not isinstance(fulltext, bytes):
                     fulltext = bytes(delta)
                 return fulltext
             def insertdelta(db, compression, hash, delta):
                 try:
                     return db.execute(
                         r'INSERT INTO delta (compression, hash, delta) '
                         r'VALUES (?, ?, ?)',
                         (compression, hash, delta)).lastrowid
                 except sqlite3.IntegrityError:
                     return db.execute(
                         r'SELECT id FROM delta WHERE hash=?',
                         (hash,)).fetchone()[0]
             class SQLiteStoreError(error.StorageError):
                 pass
             @attr.s
             class revisionentry(object):
                 rid = attr.ib()
                 rev = attr.ib()
                 node = attr.ib()
                 p1rev = attr.ib()
                 p2rev = attr.ib()
                 p1node = attr.ib()
                 p2node = attr.ib()
                 linkrev = attr.ib()
                 flags = attr.ib()
             @interfaceutil.implementer(repository.irevisiondelta)
             @attr.s(slots=True)
             class sqliterevisiondelta(object):
                 node = attr.ib()
                 p1node = attr.ib()
                 p2node = attr.ib()
                 basenode = attr.ib()
                 flags = attr.ib()
                 baserevisionsize = attr.ib()
                 revision = attr.ib()
                 delta = attr.ib()
                 linknode = attr.ib(default=None)
             @interfaceutil.implementer(repository.iverifyproblem)
             @attr.s(frozen=True)
             class sqliteproblem(object):
                 warning = attr.ib(default=None)
                 error = attr.ib(default=None)
                 node = attr.ib(default=None)
             @interfaceutil.implementer(repository.ifilestorage)
             class sqlitefilestore(object):
                 """Implements storage for an individual tracked path."""
                 def __init__(self, db, path, compression):
                     self._db = db
                     self._path = path
                     self._pathid = None
                     # revnum -> node
                     self._revtonode = {}
                     # node -> revnum
                     self._nodetorev = {}
                     # node -> data structure
                     self._revisions = {}
                     self._revisioncache = util.lrucachedict(10)
                     self._compengine = compression
                     if compression == 'zstd':
                         self._cctx = zstd.ZstdCompressor(level=3)
                         self._dctx = zstd.ZstdDecompressor()
                     else:
                         self._cctx = None
                         self._dctx = None
                     self._refreshindex()
                 def _refreshindex(self):
                     self._revtonode = {}
                     self._nodetorev = {}
                     self._revisions = {}
                     res = list(self._db.execute(
                         r'SELECT id FROM filepath WHERE path=?', (self._path,)))
                     if not res:
                         self._pathid = None
                         return
                     self._pathid = res[0][0]
                     res = self._db.execute(
                         r'SELECT id, revnum, node, p1rev, p2rev, linkrev, flags '
                         r'FROM fileindex '
                         r'WHERE pathid=? '
                         r'ORDER BY revnum ASC',
                         (self._pathid,))
                     for i, row in enumerate(res):
                         rid, rev, node, p1rev, p2rev, linkrev, flags = row
                         if i != rev:
                             raise SQLiteStoreError(_('sqlite database has inconsistent '
                                                      'revision numbers'))
                         if p1rev == nullrev:
                             p1node = nullid
                         else:
                             p1node = self._revtonode[p1rev]
                         if p2rev == nullrev:
                             p2node = nullid
                         else:
                             p2node = self._revtonode[p2rev]
                         entry = revisionentry(
                             rid=rid,
                             rev=rev,
                             node=node,
                             p1rev=p1rev,
                             p2rev=p2rev,
                             p1node=p1node,
                             p2node=p2node,
                             linkrev=linkrev,
                             flags=flags)
                         self._revtonode[rev] = node
                         self._nodetorev[node] = rev
                         self._revisions[node] = entry
                 # Start of ifileindex interface.
                 def __len__(self):
                     return len(self._revisions)
                 def __iter__(self):
                     return iter(pycompat.xrange(len(self._revisions)))
                 def hasnode(self, node):
                     if node == nullid:
                         return False
                     return node in self._nodetorev
                 def revs(self, start=0, stop=None):
                     return storageutil.iterrevs(len(self._revisions), start=start,
                                                 stop=stop)
                 def parents(self, node):
                     if node == nullid:
                         return nullid, nullid
                     if node not in self._revisions:
                         raise error.LookupError(node, self._path, _('no node'))
                     entry = self._revisions[node]
                     return entry.p1node, entry.p2node
                 def parentrevs(self, rev):
                     if rev == nullrev:
                         return nullrev, nullrev
                     if rev not in self._revtonode:
                         raise IndexError(rev)
                     entry = self._revisions[self._revtonode[rev]]
                     return entry.p1rev, entry.p2rev
                 def rev(self, node):
                     if node == nullid:
                         return nullrev
                     if node not in self._nodetorev:
                         raise error.LookupError(node, self._path, _('no node'))
                     return self._nodetorev[node]
                 def node(self, rev):
                     if rev == nullrev:
                         return nullid
                     if rev not in self._revtonode:
                         raise IndexError(rev)
                     return self._revtonode[rev]
                 def lookup(self, node):
                     return storageutil.fileidlookup(self, node, self._path)
                 def linkrev(self, rev):
                     if rev == nullrev:
                         return nullrev
                     if rev not in self._revtonode:
                         raise IndexError(rev)
                     entry = self._revisions[self._revtonode[rev]]
                     return entry.linkrev
                 def iscensored(self, rev):
                     if rev == nullrev:
                         return False
                     if rev not in self._revtonode:
                         raise IndexError(rev)
                     return self._revisions[self._revtonode[rev]].flags & FLAG_CENSORED
                 def commonancestorsheads(self, node1, node2):
                     rev1 = self.rev(node1)
                     rev2 = self.rev(node2)
                     ancestors = ancestor.commonancestorsheads(self.parentrevs, rev1, rev2)
                     return pycompat.maplist(self.node, ancestors)
                 def descendants(self, revs):
                     # TODO we could implement this using a recursive SQL query, which
                     # might be faster.
                     return dagop.descendantrevs(revs, self.revs, self.parentrevs)
                 def heads(self, start=None, stop=None):
                     if start is None and stop is None:
                         if not len(self):
                             return [nullid]
                     startrev = self.rev(start) if start is not None else nullrev
                     stoprevs = {self.rev(n) for n in stop or []}
                     revs = dagop.headrevssubset(self.revs, self.parentrevs,
                                                 startrev=startrev, stoprevs=stoprevs)
                     return [self.node(rev) for rev in revs]
                 def children(self, node):
                     rev = self.rev(node)
                     res = self._db.execute(
                         r'SELECT'
                         r'  node '
                         r'  FROM filedata '
                         r'  WHERE path=? AND (p1rev=? OR p2rev=?) '
                         r'  ORDER BY revnum ASC',
                         (self._path, rev, rev))
                     return [row[0] for row in res]
                 # End of ifileindex interface.
                 # Start of ifiledata interface.
                 def size(self, rev):
                     if rev == nullrev:
                         return 0
                     if rev not in self._revtonode:
                         raise IndexError(rev)
                     node = self._revtonode[rev]
                     if self.renamed(node):
                         return len(self.read(node))
                     return len(self.revision(node))
                 def revision(self, node, raw=False, _verifyhash=True):
                     if node in (nullid, nullrev):
                         return b''
                     if isinstance(node, int):
                         node = self.node(node)
                     if node not in self._nodetorev:
                         raise error.LookupError(node, self._path, _('no node'))
                     if node in self._revisioncache:
                         return self._revisioncache[node]
                     # Because we have a fulltext revision cache, we are able to
                     # short-circuit delta chain traversal and decompression as soon as
                     # we encounter a revision in the cache.
                     stoprids = {self._revisions[n].rid: n
                                 for n in self._revisioncache}
                     if not stoprids:
                         stoprids[-1] = None
                     fulltext = resolvedeltachain(self._db, self._pathid, node,
                                                  self._revisioncache, stoprids,
                                                  zstddctx=self._dctx)
                     # Don't verify hashes if parent nodes were rewritten, as the hash
                     # wouldn't verify.
                     if self._revisions[node].flags & (FLAG_MISSING_P1 | FLAG_MISSING_P2):
                         _verifyhash = False
                     if _verifyhash:
                         self._checkhash(fulltext, node)
                         self._revisioncache[node] = fulltext
                     return fulltext
                 def read(self, node):
                     return storageutil.filtermetadata(self.revision(node))
                 def renamed(self, node):
                     return storageutil.filerevisioncopied(self, node)
                 def cmp(self, node, fulltext):
                     return not storageutil.filedataequivalent(self, node, fulltext)
                 def emitrevisions(self, nodes, nodesorder=None, revisiondata=False,
-                                  assumehaveparentrevisions=False, deltaprevious=False):
+                                  assumehaveparentrevisions=False,
+                                  deltamode=repository.CG_DELTAMODE_STD):
                     if nodesorder not in ('nodes', 'storage', None):
                         raise error.ProgrammingError('unhandled value for nodesorder: %s' %
                                                      nodesorder)
                     nodes = [n for n in nodes if n != nullid]
                     if not nodes:
                         return
                     # TODO perform in a single query.
                     res = self._db.execute(
                         r'SELECT revnum, deltaid FROM fileindex '
                         r'WHERE pathid=? '
                         r'    AND node in (%s)' % (r','.join([r'?'] * len(nodes))),
                         tuple([self._pathid] + nodes))
                     deltabases = {}
                     for rev, deltaid in res:
                         res = self._db.execute(
                             r'SELECT revnum from fileindex WHERE pathid=? AND deltaid=?',
                             (self._pathid, deltaid))
                         deltabases[rev] = res.fetchone()[0]
                     # TODO define revdifffn so we can use delta from storage.
                     for delta in storageutil.emitrevisions(
                         self, nodes, nodesorder, sqliterevisiondelta,
                         deltaparentfn=deltabases.__getitem__,
                         revisiondata=revisiondata,
                         assumehaveparentrevisions=assumehaveparentrevisions,
-                        deltaprevious=deltaprevious):
+                        deltamode=deltamode):
                         yield delta
                 # End of ifiledata interface.
                 # Start of ifilemutation interface.
                 def add(self, filedata, meta, transaction, linkrev, p1, p2):
                     if meta or filedata.startswith(b'\x01\n'):
                         filedata = storageutil.packmeta(meta, filedata)
                     return self.addrevision(filedata, transaction, linkrev, p1, p2)
                 def addrevision(self, revisiondata, transaction, linkrev, p1, p2, node=None,
                                 flags=0, cachedelta=None):
                     if flags:
                         raise SQLiteStoreError(_('flags not supported on revisions'))
                     validatehash = node is not None
                     node = node or storageutil.hashrevisionsha1(revisiondata, p1, p2)
                     if validatehash:
                         self._checkhash(revisiondata, node, p1, p2)
                     if node in self._nodetorev:
                         return node
                     node = self._addrawrevision(node, revisiondata, transaction, linkrev,
                                                 p1, p2)
                     self._revisioncache[node] = revisiondata
                     return node
                 def addgroup(self, deltas, linkmapper, transaction, addrevisioncb=None,
                              maybemissingparents=False):
                     nodes = []
                     for node, p1, p2, linknode, deltabase, delta, wireflags in deltas:
                         storeflags = 0
                         if wireflags & repository.REVISION_FLAG_CENSORED:
                             storeflags |= FLAG_CENSORED
                         if wireflags & ~repository.REVISION_FLAG_CENSORED:
                             raise SQLiteStoreError('unhandled revision flag')
                         if maybemissingparents:
                             if p1 != nullid and not self.hasnode(p1):
                                 p1 = nullid
                                 storeflags |= FLAG_MISSING_P1
                             if p2 != nullid and not self.hasnode(p2):
                                 p2 = nullid
                                 storeflags |= FLAG_MISSING_P2
                         baserev = self.rev(deltabase)
                         # If base is censored, delta must be full replacement in a single
                         # patch operation.
                         if baserev != nullrev and self.iscensored(baserev):
                             hlen = struct.calcsize('>lll')
                             oldlen = len(self.revision(deltabase, raw=True,
                                                        _verifyhash=False))
                             newlen = len(delta) - hlen
                             if delta[:hlen] != mdiff.replacediffheader(oldlen, newlen):
                                 raise error.CensoredBaseError(self._path,
                                                               deltabase)
                         if (not (storeflags & FLAG_CENSORED)
                             and storageutil.deltaiscensored(
                                 delta, baserev, lambda x: len(self.revision(x, raw=True)))):
                             storeflags |= FLAG_CENSORED
                         linkrev = linkmapper(linknode)
                         nodes.append(node)
                         if node in self._revisions:
                             # Possibly reset parents to make them proper.
                             entry = self._revisions[node]
                             if entry.flags & FLAG_MISSING_P1 and p1 != nullid:
                                 entry.p1node = p1
                                 entry.p1rev = self._nodetorev[p1]
                                 entry.flags &= ~FLAG_MISSING_P1
                                 self._db.execute(
                                     r'UPDATE fileindex SET p1rev=?, flags=? '
                                     r'WHERE id=?',
                                     (self._nodetorev[p1], entry.flags, entry.rid))
                             if entry.flags & FLAG_MISSING_P2 and p2 != nullid:
                                 entry.p2node = p2
                                 entry.p2rev = self._nodetorev[p2]
                                 entry.flags &= ~FLAG_MISSING_P2
                                 self._db.execute(
                                     r'UPDATE fileindex SET p2rev=?, flags=? '
                                     r'WHERE id=?',
                                     (self._nodetorev[p1], entry.flags, entry.rid))
                             continue
                         if deltabase == nullid:
                             text = mdiff.patch(b'', delta)
                             storedelta = None
                         else:
                             text = None
                             storedelta = (deltabase, delta)
                         self._addrawrevision(node, text, transaction, linkrev, p1, p2,
                                              storedelta=storedelta, flags=storeflags)
                         if addrevisioncb:
                             addrevisioncb(self, node)
                     return nodes
                 def censorrevision(self, tr, censornode, tombstone=b''):
                     tombstone = storageutil.packmeta({b'censored': tombstone}, b'')
                     # This restriction is cargo culted from revlogs and makes no sense for
                     # SQLite, since columns can be resized at will.
                     if len(tombstone) > len(self.revision(censornode, raw=True)):
                         raise error.Abort(_('censor tombstone must be no longer than '
                                             'censored data'))
                     # We need to replace the censored revision's data with the tombstone.
                     # But replacing that data will have implications for delta chains that
                     # reference it.
                     #
                     # While "better," more complex strategies are possible, we do something
                     # simple: we find delta chain children of the censored revision and we
                     # replace those incremental deltas with fulltexts of their corresponding
                     # revision. Then we delete the now-unreferenced delta and original
                     # revision and insert a replacement.
                     # Find the delta to be censored.
                     censoreddeltaid = self._db.execute(
                         r'SELECT deltaid FROM fileindex WHERE id=?',
                         (self._revisions[censornode].rid,)).fetchone()[0]
                     # Find all its delta chain children.
                     # TODO once we support storing deltas for !files, we'll need to look
                     # for those delta chains too.
                     rows = list(self._db.execute(
                         r'SELECT id, pathid, node FROM fileindex '
                         r'WHERE deltabaseid=? OR deltaid=?',
                         (censoreddeltaid, censoreddeltaid)))
                     for row in rows:
                         rid, pathid, node = row
                         fulltext = resolvedeltachain(self._db, pathid, node, {}, {-1: None},
                                                      zstddctx=self._dctx)
                         deltahash = hashlib.sha1(fulltext).digest()
                         if self._compengine == 'zstd':
                             deltablob = self._cctx.compress(fulltext)
                             compression = COMPRESSION_ZSTD
                         elif self._compengine == 'zlib':
                             deltablob = zlib.compress(fulltext)
                             compression = COMPRESSION_ZLIB
                         elif self._compengine == 'none':
                             deltablob = fulltext
                             compression = COMPRESSION_NONE
                         else:
                             raise error.ProgrammingError('unhandled compression engine: %s'
                                                          % self._compengine)
                         if len(deltablob) >= len(fulltext):
                             deltablob = fulltext
                             compression = COMPRESSION_NONE
                         deltaid = insertdelta(self._db, compression, deltahash, deltablob)
                         self._db.execute(
                             r'UPDATE fileindex SET deltaid=?, deltabaseid=NULL '
                             r'WHERE id=?', (deltaid, rid))
                     # Now create the tombstone delta and replace the delta on the censored
                     # node.
                     deltahash = hashlib.sha1(tombstone).digest()
                     tombstonedeltaid = insertdelta(self._db, COMPRESSION_NONE,
                                                    deltahash, tombstone)
                     flags = self._revisions[censornode].flags
                     flags |= FLAG_CENSORED
                     self._db.execute(
                         r'UPDATE fileindex SET flags=?, deltaid=?, deltabaseid=NULL '
                         r'WHERE pathid=? AND node=?',
                         (flags, tombstonedeltaid, self._pathid, censornode))
                     self._db.execute(
                         r'DELETE FROM delta WHERE id=?', (censoreddeltaid,))
                     self._refreshindex()
                     self._revisioncache.clear()
                 def getstrippoint(self, minlink):
                     return storageutil.resolvestripinfo(minlink, len(self) - 1,
                                                         [self.rev(n) for n in self.heads()],
                                                         self.linkrev,
                                                         self.parentrevs)
                 def strip(self, minlink, transaction):
                     if not len(self):
                         return
                     rev, _ignored = self.getstrippoint(minlink)
                     if rev == len(self):
                         return
                     for rev in self.revs(rev):
                         self._db.execute(
                             r'DELETE FROM fileindex WHERE pathid=? AND node=?',
                             (self._pathid, self.node(rev)))
                     # TODO how should we garbage collect data in delta table?
                     self._refreshindex()
                 # End of ifilemutation interface.
                 # Start of ifilestorage interface.
                 def files(self):
                     return []
                 def storageinfo(self, exclusivefiles=False, sharedfiles=False,
                                 revisionscount=False, trackedsize=False,
                                 storedsize=False):
                     d = {}
                     if exclusivefiles:
                         d['exclusivefiles'] = []
                     if sharedfiles:
                         # TODO list sqlite file(s) here.
                         d['sharedfiles'] = []
                     if revisionscount:
                         d['revisionscount'] = len(self)
                     if trackedsize:
                         d['trackedsize'] = sum(len(self.revision(node))
                                                    for node in self._nodetorev)
                     if storedsize:
                         # TODO implement this?
                         d['storedsize'] = None
                     return d
                 def verifyintegrity(self, state):
                     state['skipread'] = set()
                     for rev in self:
                         node = self.node(rev)
                         try:
                             self.revision(node)
                         except Exception as e:
                             yield sqliteproblem(
                                 error=_('unpacking %s: %s') % (short(node), e),
                                 node=node)
                             state['skipread'].add(node)
                 # End of ifilestorage interface.
                 def _checkhash(self, fulltext, node, p1=None, p2=None):
                     if p1 is None and p2 is None:
                         p1, p2 = self.parents(node)
                     if node == storageutil.hashrevisionsha1(fulltext, p1, p2):
                         return
                     try:
                         del self._revisioncache[node]
                     except KeyError:
                         pass
                     if storageutil.iscensoredtext(fulltext):
                         raise error.CensoredNodeError(self._path, node, fulltext)
                     raise SQLiteStoreError(_('integrity check failed on %s') %
                                            self._path)
                 def _addrawrevision(self, node, revisiondata, transaction, linkrev,
                                     p1, p2, storedelta=None, flags=0):
                     if self._pathid is None:
                         res = self._db.execute(
                             r'INSERT INTO filepath (path) VALUES (?)', (self._path,))
                         self._pathid = res.lastrowid
                     # For simplicity, always store a delta against p1.
                     # TODO we need a lot more logic here to make behavior reasonable.
                     if storedelta:
                         deltabase, delta = storedelta
                         if isinstance(deltabase, int):
                             deltabase = self.node(deltabase)
                     else:
                         assert revisiondata is not None
                         deltabase = p1
                         if deltabase == nullid:
                             delta = revisiondata
                         else:
                             delta = mdiff.textdiff(self.revision(self.rev(deltabase)),
                                                    revisiondata)
                     # File index stores a pointer to its delta and the parent delta.
                     # The parent delta is stored via a pointer to the fileindex PK.
                     if deltabase == nullid:
                         baseid = None
                     else:
                         baseid = self._revisions[deltabase].rid
                     # Deltas are stored with a hash of their content. This allows
                     # us to de-duplicate. The table is configured to ignore conflicts
                     # and it is faster to just insert and silently noop than to look
                     # first.
                     deltahash = hashlib.sha1(delta).digest()
                     if self._compengine == 'zstd':
                         deltablob = self._cctx.compress(delta)
                         compression = COMPRESSION_ZSTD
                     elif self._compengine == 'zlib':
                         deltablob = zlib.compress(delta)
                         compression = COMPRESSION_ZLIB
                     elif self._compengine == 'none':
                         deltablob = delta
                         compression = COMPRESSION_NONE
                     else:
                         raise error.ProgrammingError('unhandled compression engine: %s' %
                                                      self._compengine)
                     # Don't store compressed data if it isn't practical.
                     if len(deltablob) >= len(delta):
                         deltablob = delta
                         compression = COMPRESSION_NONE
                     deltaid = insertdelta(self._db, compression, deltahash, deltablob)
                     rev = len(self)
                     if p1 == nullid:
                         p1rev = nullrev
                     else:
                         p1rev = self._nodetorev[p1]
                     if p2 == nullid:
                         p2rev = nullrev
                     else:
                         p2rev = self._nodetorev[p2]
                     rid = self._db.execute(
                         r'INSERT INTO fileindex ('
                         r'    pathid, revnum, node, p1rev, p2rev, linkrev, flags, '
                         r'    deltaid, deltabaseid) '
                         r'    VALUES (?, ?, ?, ?, ?, ?, ?, ?, ?)',
                         (self._pathid, rev, node, p1rev, p2rev, linkrev, flags,
                          deltaid, baseid)
                     ).lastrowid
                     entry = revisionentry(
                         rid=rid,
                         rev=rev,
                         node=node,
                         p1rev=p1rev,
                         p2rev=p2rev,
                         p1node=p1,
                         p2node=p2,
                         linkrev=linkrev,
                         flags=flags)
                     self._nodetorev[node] = rev
                     self._revtonode[rev] = node
                     self._revisions[node] = entry
                     return node
             class sqliterepository(localrepo.localrepository):
                 def cancopy(self):
                     return False
                 def transaction(self, *args, **kwargs):
                     current = self.currenttransaction()
                     tr = super(sqliterepository, self).transaction(*args, **kwargs)
                     if current:
                         return tr
                     self._dbconn.execute(r'BEGIN TRANSACTION')
                     def committransaction(_):
                         self._dbconn.commit()
                     tr.addfinalize('sqlitestore', committransaction)
                     return tr
                 @property
                 def _dbconn(self):
                     # SQLite connections can only be used on the thread that created
                     # them. In most cases, this "just works." However, hgweb uses
                     # multiple threads.
                     tid = threading.current_thread().ident
                     if self._db:
                         if self._db[0] == tid:
                             return self._db[1]
                     db = makedb(self.svfs.join('db.sqlite'))
                     self._db = (tid, db)
                     return db
             def makedb(path):
                 """Construct a database handle for a database at path."""
                 db = sqlite3.connect(encoding.strfromlocal(path))
                 db.text_factory = bytes
                 res = db.execute(r'PRAGMA user_version').fetchone()[0]
                 # New database.
                 if res == 0:
                     for statement in CREATE_SCHEMA:
                         db.execute(statement)
                     db.commit()
                 elif res == CURRENT_SCHEMA_VERSION:
                     pass
                 else:
                     raise error.Abort(_('sqlite database has unrecognized version'))
                 db.execute(r'PRAGMA journal_mode=WAL')
                 return db
             def featuresetup(ui, supported):
                 supported.add(REQUIREMENT)
                 if zstd:
                     supported.add(REQUIREMENT_ZSTD)
                 supported.add(REQUIREMENT_ZLIB)
                 supported.add(REQUIREMENT_NONE)
                 supported.add(REQUIREMENT_SHALLOW_FILES)
                 supported.add(repository.NARROW_REQUIREMENT)
             def newreporequirements(orig, ui, createopts):
                 if createopts['backend'] != 'sqlite':
                     return orig(ui, createopts)
                 # This restriction can be lifted once we have more confidence.
                 if 'sharedrepo' in createopts:
                     raise error.Abort(_('shared repositories not supported with SQLite '
                                         'store'))
                 # This filtering is out of an abundance of caution: we want to ensure
                 # we honor creation options and we do that by annotating exactly the
                 # creation options we recognize.
                 known = {
                     'narrowfiles',
                     'backend',
                     'shallowfilestore',
                 }
                 unsupported = set(createopts) - known
                 if unsupported:
                     raise error.Abort(_('SQLite store does not support repo creation '
                                         'option: %s') % ', '.join(sorted(unsupported)))
                 # Since we're a hybrid store that still relies on revlogs, we fall back
                 # to using the revlogv1 backend's storage requirements then adding our
                 # own requirement.
                 createopts['backend'] = 'revlogv1'
                 requirements = orig(ui, createopts)
                 requirements.add(REQUIREMENT)
                 compression = ui.config('storage', 'sqlite.compression')
                 if compression == 'zstd' and not zstd:
                     raise error.Abort(_('storage.sqlite.compression set to "zstd" but '
                                         'zstandard compression not available to this '
                                         'Mercurial install'))
                 if compression == 'zstd':
                     requirements.add(REQUIREMENT_ZSTD)
                 elif compression == 'zlib':
                     requirements.add(REQUIREMENT_ZLIB)
                 elif compression == 'none':
                     requirements.add(REQUIREMENT_NONE)
                 else:
                     raise error.Abort(_('unknown compression engine defined in '
                                         'storage.sqlite.compression: %s') % compression)
                 if createopts.get('shallowfilestore'):
                     requirements.add(REQUIREMENT_SHALLOW_FILES)
                 return requirements
             @interfaceutil.implementer(repository.ilocalrepositoryfilestorage)
             class sqlitefilestorage(object):
                 """Repository file storage backed by SQLite."""
                 def file(self, path):
                     if path[0] == b'/':
                         path = path[1:]
                     if REQUIREMENT_ZSTD in self.requirements:
                         compression = 'zstd'
                     elif REQUIREMENT_ZLIB in self.requirements:
                         compression = 'zlib'
                     elif REQUIREMENT_NONE in self.requirements:
                         compression = 'none'
                     else:
                         raise error.Abort(_('unable to determine what compression engine '
                                             'to use for SQLite storage'))
                     return sqlitefilestore(self._dbconn, path, compression)
             def makefilestorage(orig, requirements, features, **kwargs):
                 """Produce a type conforming to ``ilocalrepositoryfilestorage``."""
                 if REQUIREMENT in requirements:
                     if REQUIREMENT_SHALLOW_FILES in requirements:
                         features.add(repository.REPO_FEATURE_SHALLOW_FILE_STORAGE)
                     return sqlitefilestorage
                 else:
                     return orig(requirements=requirements, features=features, **kwargs)
             def makemain(orig, ui, requirements, **kwargs):
                 if REQUIREMENT in requirements:
                     if REQUIREMENT_ZSTD in requirements and not zstd:
                         raise error.Abort(_('repository uses zstandard compression, which '
                                             'is not available to this Mercurial install'))
                     return sqliterepository
                 return orig(requirements=requirements, **kwargs)
             def verifierinit(orig, self, *args, **kwargs):
                 orig(self, *args, **kwargs)
                 # We don't care that files in the store don't align with what is
                 # advertised. So suppress these warnings.
                 self.warnorphanstorefiles = False
             def extsetup(ui):
                 localrepo.featuresetupfuncs.add(featuresetup)
                 extensions.wrapfunction(localrepo, 'newreporequirements',
                                         newreporequirements)
                 extensions.wrapfunction(localrepo, 'makefilestorage',
                                         makefilestorage)
                 extensions.wrapfunction(localrepo, 'makemain',
                                         makemain)
                 extensions.wrapfunction(verify.verifier, '__init__',
                                         verifierinit)
             def reposetup(ui, repo):
                 if isinstance(repo, sqliterepository):
                     repo._db = None
                 # TODO check for bundlerepository?