upstream/mercurial-mirror Commit - r45294:261e7175

1

# nodemap.py - nodemap related code and utilities

1

# nodemap.py - nodemap related code and utilities

2

#

2

#

3

4

5

#

5

#

6

# This software may be used and distributed according to the terms of the

6

# This software may be used and distributed according to the terms of the

7

# GNU General Public License version 2 or any later version.

7

# GNU General Public License version 2 or any later version.

8

9

from __future__ import absolute_import

9

from __future__ import absolute_import

10

11

import errno

11

import errno

12

import os

12

import os

13

import re

13

import re

14

import struct

14

import struct

15

16

from ..i18n import _

16

from ..i18n import _

17

18

from .. import (

18

from .. import (

19

error,

19

error,

20

node as nodemod,

20

node as nodemod,

21

util,

21

util,

22

)

22

)

23

24

25

class NodeMap(dict):

25

class NodeMap(dict):

26

def __missing__(self, x):

26

def __missing__(self, x):

27

raise error.RevlogError(b'unknown node: %s' % x)

27

raise error.RevlogError(b'unknown node: %s' % x)

28

29

30

def persisted_data(revlog):

30

def persisted_data(revlog):

31

"""read the nodemap for a revlog from disk"""

31

"""read the nodemap for a revlog from disk"""

32

if revlog.nodemap_file is None:

32

if revlog.nodemap_file is None:

33

return None

33

return None

34

pdata = revlog.opener.tryread(revlog.nodemap_file)

34

pdata = revlog.opener.tryread(revlog.nodemap_file)

35

if not pdata:

35

if not pdata:

36

return None

36

return None

37

offset = 0

37

offset = 0

38

(version,) = S_VERSION.unpack(pdata[offset : offset + S_VERSION.size])

38

(version,) = S_VERSION.unpack(pdata[offset : offset + S_VERSION.size])

39

if version != ONDISK_VERSION:

39

if version != ONDISK_VERSION:

40

return None

40

return None

41

offset += S_VERSION.size

41

offset += S_VERSION.size

42

headers = S_HEADER.unpack(pdata[offset : offset + S_HEADER.size])

42

headers = S_HEADER.unpack(pdata[offset : offset + S_HEADER.size])

43

uid_size, tip_rev, data_length, data_unused, tip_node_size = headers

43

uid_size, tip_rev, data_length, data_unused, tip_node_size = headers

44

offset += S_HEADER.size

44

offset += S_HEADER.size

45

docket = NodeMapDocket(pdata[offset : offset + uid_size])

45

docket = NodeMapDocket(pdata[offset : offset + uid_size])

46

offset += uid_size

46

offset += uid_size

47

docket.tip_rev = tip_rev

47

docket.tip_rev = tip_rev

48

docket.tip_node = pdata[offset : offset + tip_node_size]

48

docket.tip_node = pdata[offset : offset + tip_node_size]

49

docket.data_length = data_length

49

docket.data_length = data_length

50

docket.data_unused = data_unused

50

docket.data_unused = data_unused

51

52

filename = _rawdata_filepath(revlog, docket)

52

filename = _rawdata_filepath(revlog, docket)

53

use_mmap = revlog.opener.options.get(b"exp-persistent-nodemap.mmap")

53

use_mmap = revlog.opener.options.get(b"exp-persistent-nodemap.mmap")

54

try:

54

try:

55

with revlog.opener(filename) as fd:

55

with revlog.opener(filename) as fd:

56

if use_mmap:

56

if use_mmap:

57

data = util.buffer(util.mmapread(fd, data_length))

57

data = util.buffer(util.mmapread(fd, data_length))

58

else:

58

else:

59

data = fd.read(data_length)

59

data = fd.read(data_length)

60

except OSError as e:

60

except OSError as e:

61

if e.errno != errno.ENOENT:

61

if e.errno != errno.ENOENT:

62

raise

62

raise

63

if len(data) < data_length:

63

if len(data) < data_length:

64

return None

64

return None

65

return docket, data

65

return docket, data

66

67

68

def setup_persistent_nodemap(tr, revlog):

68

def setup_persistent_nodemap(tr, revlog):

69

"""Install whatever is needed transaction side to persist a nodemap on disk

69

"""Install whatever is needed transaction side to persist a nodemap on disk

70

71

(only actually persist the nodemap if this is relevant for this revlog)

71

(only actually persist the nodemap if this is relevant for this revlog)

72

"""

72

"""

73

if revlog._inline:

73

if revlog._inline:

74

return # inlined revlog are too small for this to be relevant

74

return # inlined revlog are too small for this to be relevant

75

if revlog.nodemap_file is None:

75

if revlog.nodemap_file is None:

76

return # we do not use persistent_nodemap on this revlog

76

return # we do not use persistent_nodemap on this revlog

77

78

# we need to happen after the changelog finalization, in that use "cl-"

78

# we need to happen after the changelog finalization, in that use "cl-"

79

callback_id = b"nm-revlog-persistent-nodemap-%s" % revlog.nodemap_file

79

callback_id = b"nm-revlog-persistent-nodemap-%s" % revlog.nodemap_file

80

if tr.hasfinalize(callback_id):

80

if tr.hasfinalize(callback_id):

81

return # no need to register again

81

return # no need to register again

82

tr.addpending(

82

tr.addpending(

83

callback_id, lambda tr: _persist_nodemap(tr, revlog, pending=True)

83

callback_id, lambda tr: _persist_nodemap(tr, revlog, pending=True)

84

)

84

)

85

tr.addfinalize(callback_id, lambda tr: _persist_nodemap(tr, revlog))

85

tr.addfinalize(callback_id, lambda tr: _persist_nodemap(tr, revlog))

86

87

88

class _NoTransaction(object):

88

class _NoTransaction(object):

89

"""transaction like object to update the nodemap outside a transaction

89

"""transaction like object to update the nodemap outside a transaction

90

"""

90

"""

91

92

def __init__(self):

92

def __init__(self):

93

self._postclose = {}

93

self._postclose = {}

94

95

def addpostclose(self, callback_id, callback_func):

95

def addpostclose(self, callback_id, callback_func):

96

self._postclose[callback_id] = callback_func

96

self._postclose[callback_id] = callback_func

97

98

def registertmp(self, *args, **kwargs):

98

def registertmp(self, *args, **kwargs):

99

pass

99

pass

100

101

def addbackup(self, *args, **kwargs):

101

def addbackup(self, *args, **kwargs):

102

pass

102

pass

103

104

def add(self, *args, **kwargs):

104

def add(self, *args, **kwargs):

105

pass

105

pass

106

107

def addabort(self, *args, **kwargs):

107

def addabort(self, *args, **kwargs):

108

pass

108

pass

109

110

def _report(self, *args):

110

def _report(self, *args):

111

pass

111

pass

112

113

114

def update_persistent_nodemap(revlog):

114

def update_persistent_nodemap(revlog):

115

"""update the persistent nodemap right now

115

"""update the persistent nodemap right now

116

117

To be used for updating the nodemap on disk outside of a normal transaction

117

To be used for updating the nodemap on disk outside of a normal transaction

118

setup (eg, `debugupdatecache`).

118

setup (eg, `debugupdatecache`).

119

"""

119

"""

120

if revlog._inline:

120

if revlog._inline:

121

return # inlined revlog are too small for this to be relevant

121

return # inlined revlog are too small for this to be relevant

122

if revlog.nodemap_file is None:

122

if revlog.nodemap_file is None:

123

return # we do not use persistent_nodemap on this revlog

123

return # we do not use persistent_nodemap on this revlog

124

125

notr = _NoTransaction()

125

notr = _NoTransaction()

126

_persist_nodemap(notr, revlog)

126

_persist_nodemap(notr, revlog)

127

for k in sorted(notr._postclose):

127

for k in sorted(notr._postclose):

128

notr._postclose[k](None)

128

notr._postclose[k](None)

129

130

131

def _persist_nodemap(tr, revlog, pending=False):

131

def _persist_nodemap(tr, revlog, pending=False):

132

"""Write nodemap data on disk for a given revlog

132

"""Write nodemap data on disk for a given revlog

133

"""

133

"""

134

if getattr(revlog, 'filteredrevs', ()):

134

if getattr(revlog, 'filteredrevs', ()):

135

raise error.ProgrammingError(

135

raise error.ProgrammingError(

136

"cannot persist nodemap of a filtered changelog"

136

"cannot persist nodemap of a filtered changelog"

137

)

137

)

138

if revlog.nodemap_file is None:

138

if revlog.nodemap_file is None:

139

msg = "calling persist nodemap on a revlog without the feature enableb"

139

msg = "calling persist nodemap on a revlog without the feature enableb"

140

raise error.ProgrammingError(msg)

140

raise error.ProgrammingError(msg)

141

142

can_incremental = util.safehasattr(revlog.index, "nodemap_data_incremental")

142

can_incremental = util.safehasattr(revlog.index, "nodemap_data_incremental")

143

ondisk_docket = revlog._nodemap_docket

143

ondisk_docket = revlog._nodemap_docket

144

feed_data = util.safehasattr(revlog.index, "update_nodemap_data")

144

feed_data = util.safehasattr(revlog.index, "update_nodemap_data")

145

use_mmap = revlog.opener.options.get(b"exp-persistent-nodemap.mmap")

145

use_mmap = revlog.opener.options.get(b"exp-persistent-nodemap.mmap")

146

mode = revlog.opener.options.get(b"exp-persistent-nodemap.mode")

146

mode = revlog.opener.options.get(b"exp-persistent-nodemap.mode")

147

if not can_incremental:

147

if not can_incremental:

148

msg = _(b"persistent nodemap in strict mode without efficient method")

148

msg = _(b"persistent nodemap in strict mode without efficient method")

149

if mode == b'warn':

149

if mode == b'warn':

150

tr._report(b"%s\n" % msg)

150

tr._report(b"%s\n" % msg)

151

elif mode == b'strict':

151

elif mode == b'strict':

152

raise error.Abort(msg)

152

raise error.Abort(msg)

153

154

data = None

154

data = None

155

# first attemp an incremental update of the data

155

# first attemp an incremental update of the data

156

if can_incremental and ondisk_docket is not None:

156

if can_incremental and ondisk_docket is not None:

157

target_docket = revlog._nodemap_docket.copy()

157

target_docket = revlog._nodemap_docket.copy()

158

(

158

(

159

src_docket,

159

src_docket,

160

data_changed_count,

160

data_changed_count,

161

data,

161

data,

162

) = revlog.index.nodemap_data_incremental()

162

) = revlog.index.nodemap_data_incremental()

163

new_length = target_docket.data_length + len(data)

163

new_length = target_docket.data_length + len(data)

164

new_unused = target_docket.data_unused + data_changed_count

164

new_unused = target_docket.data_unused + data_changed_count

165

if src_docket != target_docket:

165

if src_docket != target_docket:

166

data = None

166

data = None

167

elif new_length <= (new_unused * 10): # under 10% of unused data

167

elif new_length <= (new_unused * 10): # under 10% of unused data

168

data = None

168

data = None

169

else:

169

else:

170

datafile = _rawdata_filepath(revlog, target_docket)

170

datafile = _rawdata_filepath(revlog, target_docket)

171

# EXP-TODO: if this is a cache, this should use a cache vfs, not a

171

# EXP-TODO: if this is a cache, this should use a cache vfs, not a

172

# store vfs

172

# store vfs

173

tr.add(datafile, target_docket.data_length)

173

tr.add(datafile, target_docket.data_length)

174

with revlog.opener(datafile, b'r+') as fd:

174

with revlog.opener(datafile, b'r+') as fd:

175

fd.seek(target_docket.data_length)

175

fd.seek(target_docket.data_length)

176

fd.write(data)

176

fd.write(data)

177

if feed_data:

177

if feed_data:

178

if use_mmap:

178

if use_mmap:

179

fd.seek(0)

179

fd.seek(0)

180

new_data = fd.read(new_length)

180

new_data = fd.read(new_length)

181

else:

181

else:

182

fd.flush()

182

fd.flush()

183

new_data = util.buffer(util.mmapread(fd, new_length))

183

new_data = util.buffer(util.mmapread(fd, new_length))

184

target_docket.data_length = new_length

184

target_docket.data_length = new_length

185

target_docket.data_unused = new_unused

185

target_docket.data_unused = new_unused

186

187

if data is None:

187

if data is None:

188

# otherwise fallback to a full new export

188

# otherwise fallback to a full new export

189

target_docket = NodeMapDocket()

189

target_docket = NodeMapDocket()

190

datafile = _rawdata_filepath(revlog, target_docket)

190

datafile = _rawdata_filepath(revlog, target_docket)

191

if util.safehasattr(revlog.index, "nodemap_data_all"):

191

if util.safehasattr(revlog.index, "nodemap_data_all"):

192

data = revlog.index.nodemap_data_all()

192

data = revlog.index.nodemap_data_all()

193

else:

193

else:

194

data = persistent_data(revlog.index)

194

data = persistent_data(revlog.index)

195

# EXP-TODO: if this is a cache, this should use a cache vfs, not a

195

# EXP-TODO: if this is a cache, this should use a cache vfs, not a

196

# store vfs

196

# store vfs

197

198

tryunlink = revlog.opener.tryunlink

198

tryunlink = revlog.opener.tryunlink

199

200

def abortck(tr):

200

def abortck(tr):

201

tryunlink(datafile)

201

tryunlink(datafile)

202

203

callback_id = b"delete-%s" % datafile

203

callback_id = b"delete-%s" % datafile

204

205

# some flavor of the transaction abort does not cleanup new file, it

205

# some flavor of the transaction abort does not cleanup new file, it

206

# simply empty them.

206

# simply empty them.

207

tr.addabort(callback_id, abortck)

207

tr.addabort(callback_id, abortck)

208

with revlog.opener(datafile, b'w+') as fd:

208

with revlog.opener(datafile, b'w+') as fd:

209

fd.write(data)

209

fd.write(data)

210

if feed_data:

210

if feed_data:

211

if use_mmap:

211

if use_mmap:

212

new_data = data

212

new_data = data

213

else:

213

else:

214

fd.flush()

214

fd.flush()

215

new_data = util.buffer(util.mmapread(fd, len(data)))

215

new_data = util.buffer(util.mmapread(fd, len(data)))

216

target_docket.data_length = len(data)

216

target_docket.data_length = len(data)

217

target_docket.tip_rev = revlog.tiprev()

217

target_docket.tip_rev = revlog.tiprev()

218

target_docket.tip_node = revlog.node(target_docket.tip_rev)

218

target_docket.tip_node = revlog.node(target_docket.tip_rev)

219

# EXP-TODO: if this is a cache, this should use a cache vfs, not a

219

# EXP-TODO: if this is a cache, this should use a cache vfs, not a

220

# store vfs

220

# store vfs

221

file_path = revlog.nodemap_file

221

file_path = revlog.nodemap_file

222

if pending:

222

if pending:

223

file_path += b'.a'

223

file_path += b'.a'

224

tr.registertmp(file_path)

224

tr.registertmp(file_path)

225

else:

225

else:

226

tr.addbackup(file_path)

226

tr.addbackup(file_path)

227

228

with revlog.opener(file_path, b'w', atomictemp=True) as fp:

228

with revlog.opener(file_path, b'w', atomictemp=True) as fp:

229

fp.write(target_docket.serialize())

229

fp.write(target_docket.serialize())

230

revlog._nodemap_docket = target_docket

230

revlog._nodemap_docket = target_docket

231

if feed_data:

231

if feed_data:

232

revlog.index.update_nodemap_data(target_docket, new_data)

232

revlog.index.update_nodemap_data(target_docket, new_data)

233

234

# search for old index file in all cases, some older process might have

234

# search for old index file in all cases, some older process might have

235

# left one behind.

235

# left one behind.

236

olds = _other_rawdata_filepath(revlog, target_docket)

236

olds = _other_rawdata_filepath(revlog, target_docket)

237

if olds:

237

if olds:

238

realvfs = getattr(revlog, '_realopener', revlog.opener)

238

realvfs = getattr(revlog, '_realopener', revlog.opener)

239

240

def cleanup(tr):

240

def cleanup(tr):

241

for oldfile in olds:

241

for oldfile in olds:

242

realvfs.tryunlink(oldfile)

242

realvfs.tryunlink(oldfile)

243

244

callback_id = b"revlog-cleanup-nodemap-%s" % revlog.nodemap_file

244

callback_id = b"revlog-cleanup-nodemap-%s" % revlog.nodemap_file

245

tr.addpostclose(callback_id, cleanup)

245

tr.addpostclose(callback_id, cleanup)

246

247

248

### Nodemap docket file

248

### Nodemap docket file

249

#

249

#

250

# The nodemap data are stored on disk using 2 files:

250

# The nodemap data are stored on disk using 2 files:

251

#

251

#

252

# * a raw data files containing a persistent nodemap

252

# * a raw data files containing a persistent nodemap

253

# (see `Nodemap Trie` section)

253

# (see `Nodemap Trie` section)

254

#

254

#

255

# * a small "docket" file containing medatadata

255

# * a small "docket" file containing medatadata

256

#

256

#

257

# While the nodemap data can be multiple tens of megabytes, the "docket" is

257

# While the nodemap data can be multiple tens of megabytes, the "docket" is

258

# small, it is easy to update it automatically or to duplicated its content

258

# small, it is easy to update it automatically or to duplicated its content

259

# during a transaction.

259

# during a transaction.

260

#

260

#

261

# Multiple raw data can exist at the same time (The currently valid one and a

261

# Multiple raw data can exist at the same time (The currently valid one and a

262

# new one beind used by an in progress transaction). To accomodate this, the

262

# new one beind used by an in progress transaction). To accomodate this, the

263

# filename hosting the raw data has a variable parts. The exact filename is

263

# filename hosting the raw data has a variable parts. The exact filename is

264

# specified inside the "docket" file.

264

# specified inside the "docket" file.

265

#

265

#

266

# The docket file contains information to find, qualify and validate the raw

266

# The docket file contains information to find, qualify and validate the raw

267

# data. Its content is currently very light, but it will expand as the on disk

267

# data. Its content is currently very light, but it will expand as the on disk

268

# nodemap gains the necessary features to be used in production.

268

# nodemap gains the necessary features to be used in production.

269

270

# version 0 is experimental, no BC garantee, do no use outside of tests.

270

ONDISK_VERSION = 1

271

ONDISK_VERSION = 0

272

S_VERSION = struct.Struct(">B")

271

S_VERSION = struct.Struct(">B")

273

S_HEADER = struct.Struct(">BQQQQ")

272

S_HEADER = struct.Struct(">BQQQQ")

274

273

275

ID_SIZE = 8

274

ID_SIZE = 8

276

275

277

276

278

def _make_uid():

277

def _make_uid():

279

"""return a new unique identifier.

278

"""return a new unique identifier.

280

279

281

The identifier is random and composed of ascii characters."""

280

The identifier is random and composed of ascii characters."""

282

return nodemod.hex(os.urandom(ID_SIZE))

281

return nodemod.hex(os.urandom(ID_SIZE))

283

282

284

283

285

class NodeMapDocket(object):

284

class NodeMapDocket(object):

286

"""metadata associated with persistent nodemap data

285

"""metadata associated with persistent nodemap data

287

286

288

The persistent data may come from disk or be on their way to disk.

287

The persistent data may come from disk or be on their way to disk.

289

"""

288

"""

290

289

291

def __init__(self, uid=None):

290

def __init__(self, uid=None):

292

if uid is None:

291

if uid is None:

293

uid = _make_uid()

292

uid = _make_uid()

294

# a unique identifier for the data file:

293

# a unique identifier for the data file:

295

# - When new data are appended, it is preserved.

294

# - When new data are appended, it is preserved.

296

# - When a new data file is created, a new identifier is generated.

295

# - When a new data file is created, a new identifier is generated.

297

self.uid = uid

296

self.uid = uid

298

# the tipmost revision stored in the data file. This revision and all

297

# the tipmost revision stored in the data file. This revision and all

299

# revision before it are expected to be encoded in the data file.

298

# revision before it are expected to be encoded in the data file.

300

self.tip_rev = None

299

self.tip_rev = None

301

# the node of that tipmost revision, if it mismatch the current index

300

# the node of that tipmost revision, if it mismatch the current index

302

# data the docket is not valid for the current index and should be

301

# data the docket is not valid for the current index and should be

303

# discarded.

302

# discarded.

304

#

303

#

305

# note: this method is not perfect as some destructive operation could

304

# note: this method is not perfect as some destructive operation could

306

# preserve the same tip_rev + tip_node while altering lower revision.

305

# preserve the same tip_rev + tip_node while altering lower revision.

307

# However this multiple other caches have the same vulnerability (eg:

306

# However this multiple other caches have the same vulnerability (eg:

308

# brancmap cache).

307

# brancmap cache).

309

self.tip_node = None

308

self.tip_node = None

310

# the size (in bytes) of the persisted data to encode the nodemap valid

309

# the size (in bytes) of the persisted data to encode the nodemap valid

311

# for `tip_rev`.

310

# for `tip_rev`.

312

# - data file shorter than this are corrupted,

311

# - data file shorter than this are corrupted,

313

# - any extra data should be ignored.

312

# - any extra data should be ignored.

314

self.data_length = None

313

self.data_length = None

315

# the amount (in bytes) of "dead" data, still in the data file but no

314

# the amount (in bytes) of "dead" data, still in the data file but no

316

# longer used for the nodemap.

315

# longer used for the nodemap.

317

self.data_unused = 0

316

self.data_unused = 0

318

317

319

def copy(self):

318

def copy(self):

320

new = NodeMapDocket(uid=self.uid)

319

new = NodeMapDocket(uid=self.uid)

321

new.tip_rev = self.tip_rev

320

new.tip_rev = self.tip_rev

322

new.tip_node = self.tip_node

321

new.tip_node = self.tip_node

323

new.data_length = self.data_length

322

new.data_length = self.data_length

324

new.data_unused = self.data_unused

323

new.data_unused = self.data_unused

325

return new

324

return new

326

325

327

def __cmp__(self, other):

326

def __cmp__(self, other):

328

if self.uid < other.uid:

327

if self.uid < other.uid:

329

return -1

328

return -1

330

if self.uid > other.uid:

329

if self.uid > other.uid:

331

return 1

330

return 1

332

elif self.data_length < other.data_length:

331

elif self.data_length < other.data_length:

333

return -1

332

return -1

334

elif self.data_length > other.data_length:

333

elif self.data_length > other.data_length:

335

return 1

334

return 1

336

return 0

335

return 0

337

336

338

def __eq__(self, other):

337

def __eq__(self, other):

339

return self.uid == other.uid and self.data_length == other.data_length

338

return self.uid == other.uid and self.data_length == other.data_length

340

339

341

def serialize(self):

340

def serialize(self):

342

"""return serialized bytes for a docket using the passed uid"""

341

"""return serialized bytes for a docket using the passed uid"""

343

data = []

342

data = []

344

data.append(S_VERSION.pack(ONDISK_VERSION))

343

data.append(S_VERSION.pack(ONDISK_VERSION))

345

headers = (

344

headers = (

346

len(self.uid),

345

len(self.uid),

347

self.tip_rev,

346

self.tip_rev,

348

self.data_length,

347

self.data_length,

349

self.data_unused,

348

self.data_unused,

350

len(self.tip_node),

349

len(self.tip_node),

351

)

350

)

352

data.append(S_HEADER.pack(*headers))

351

data.append(S_HEADER.pack(*headers))

353

data.append(self.uid)

352

data.append(self.uid)

354

data.append(self.tip_node)

353

data.append(self.tip_node)

355

return b''.join(data)

354

return b''.join(data)

356

355

357

356

358

def _rawdata_filepath(revlog, docket):

357

def _rawdata_filepath(revlog, docket):

359

"""The (vfs relative) nodemap's rawdata file for a given uid"""

358

"""The (vfs relative) nodemap's rawdata file for a given uid"""

360

if revlog.nodemap_file.endswith(b'.n.a'):

359

if revlog.nodemap_file.endswith(b'.n.a'):

361

prefix = revlog.nodemap_file[:-4]

360

prefix = revlog.nodemap_file[:-4]

362

else:

361

else:

363

prefix = revlog.nodemap_file[:-2]

362

prefix = revlog.nodemap_file[:-2]

364

return b"%s-%s.nd" % (prefix, docket.uid)

363

return b"%s-%s.nd" % (prefix, docket.uid)

365

364

366

365

367

def _other_rawdata_filepath(revlog, docket):

366

def _other_rawdata_filepath(revlog, docket):

368

prefix = revlog.nodemap_file[:-2]

367

prefix = revlog.nodemap_file[:-2]

369

pattern = re.compile(br"(^|/)%s-[0-9a-f]+\.nd$" % prefix)

368

pattern = re.compile(br"(^|/)%s-[0-9a-f]+\.nd$" % prefix)

370

new_file_path = _rawdata_filepath(revlog, docket)

369

new_file_path = _rawdata_filepath(revlog, docket)

371

new_file_name = revlog.opener.basename(new_file_path)

370

new_file_name = revlog.opener.basename(new_file_path)

372

dirpath = revlog.opener.dirname(new_file_path)

371

dirpath = revlog.opener.dirname(new_file_path)

373

others = []

372

others = []

374

for f in revlog.opener.listdir(dirpath):

373

for f in revlog.opener.listdir(dirpath):

375

if pattern.match(f) and f != new_file_name:

374

if pattern.match(f) and f != new_file_name:

376

others.append(f)

375

others.append(f)

377

return others

376

return others

378

377

379

378

380

### Nodemap Trie

379

### Nodemap Trie

381

#

380

#

382

# This is a simple reference implementation to compute and persist a nodemap

381

# This is a simple reference implementation to compute and persist a nodemap

383

# trie. This reference implementation is write only. The python version of this

382

# trie. This reference implementation is write only. The python version of this

384

# is not expected to be actually used, since it wont provide performance

383

# is not expected to be actually used, since it wont provide performance

385

# improvement over existing non-persistent C implementation.

384

# improvement over existing non-persistent C implementation.

386

#

385

#

387

# The nodemap is persisted as Trie using 4bits-address/16-entries block. each

386

# The nodemap is persisted as Trie using 4bits-address/16-entries block. each

388

# revision can be adressed using its node shortest prefix.

387

# revision can be adressed using its node shortest prefix.

389

#

388

#

390

# The trie is stored as a sequence of block. Each block contains 16 entries

389

# The trie is stored as a sequence of block. Each block contains 16 entries

391

# (signed 64bit integer, big endian). Each entry can be one of the following:

390

# (signed 64bit integer, big endian). Each entry can be one of the following:

392

#

391

#

393

# * value >= 0 -> index of sub-block

392

# * value >= 0 -> index of sub-block

394

# * value == -1 -> no value

393

# * value == -1 -> no value

395

# * value < -1 -> a revision value: rev = -(value+10)

394

# * value < -1 -> a revision value: rev = -(value+10)

396

#

395

#

397

# The implementation focus on simplicity, not on performance. A Rust

396

# The implementation focus on simplicity, not on performance. A Rust

398

# implementation should provide a efficient version of the same binary

397

# implementation should provide a efficient version of the same binary

399

# persistence. This reference python implementation is never meant to be

398

# persistence. This reference python implementation is never meant to be

400

# extensively use in production.

399

# extensively use in production.

401

400

402

401

403

def persistent_data(index):

402

def persistent_data(index):

404

"""return the persistent binary form for a nodemap for a given index

403

"""return the persistent binary form for a nodemap for a given index

405

"""

404

"""

406

trie = _build_trie(index)

405

trie = _build_trie(index)

407

return _persist_trie(trie)

406

return _persist_trie(trie)

408

407

409

408

410

def update_persistent_data(index, root, max_idx, last_rev):

409

def update_persistent_data(index, root, max_idx, last_rev):

411

"""return the incremental update for persistent nodemap from a given index

410

"""return the incremental update for persistent nodemap from a given index

412

"""

411

"""

413

changed_block, trie = _update_trie(index, root, last_rev)

412

changed_block, trie = _update_trie(index, root, last_rev)

414

return (

413

return (

415

changed_block * S_BLOCK.size,

414

changed_block * S_BLOCK.size,

416

_persist_trie(trie, existing_idx=max_idx),

415

_persist_trie(trie, existing_idx=max_idx),

417

)

416

)

418

417

419

418

420

S_BLOCK = struct.Struct(">" + ("l" * 16))

419

S_BLOCK = struct.Struct(">" + ("l" * 16))

421

420

422

NO_ENTRY = -1

421

NO_ENTRY = -1

423

# rev 0 need to be -2 because 0 is used by block, -1 is a special value.

422

# rev 0 need to be -2 because 0 is used by block, -1 is a special value.

424

REV_OFFSET = 2

423

REV_OFFSET = 2

425

424

426

425

427

def _transform_rev(rev):

426

def _transform_rev(rev):

428

"""Return the number used to represent the rev in the tree.

427

"""Return the number used to represent the rev in the tree.

429

428

430

(or retrieve a rev number from such representation)

429

(or retrieve a rev number from such representation)

431

430

432

Note that this is an involution, a function equal to its inverse (i.e.

431

Note that this is an involution, a function equal to its inverse (i.e.

433

which gives the identity when applied to itself).

432

which gives the identity when applied to itself).

434

"""

433

"""

435

return -(rev + REV_OFFSET)

434

return -(rev + REV_OFFSET)

436

435

437

436

438

def _to_int(hex_digit):

437

def _to_int(hex_digit):

439

"""turn an hexadecimal digit into a proper integer"""

438

"""turn an hexadecimal digit into a proper integer"""

440

return int(hex_digit, 16)

439

return int(hex_digit, 16)

441

440

442

441

443

class Block(dict):

442

class Block(dict):

444

"""represent a block of the Trie

443

"""represent a block of the Trie

445

444

446

contains up to 16 entry indexed from 0 to 15"""

445

contains up to 16 entry indexed from 0 to 15"""

447

446

448

def __init__(self):

447

def __init__(self):

449

super(Block, self).__init__()

448

super(Block, self).__init__()

450

# If this block exist on disk, here is its ID

449

# If this block exist on disk, here is its ID

451

self.ondisk_id = None

450

self.ondisk_id = None

452

451

453

def __iter__(self):

452

def __iter__(self):

454

return iter(self.get(i) for i in range(16))

453

return iter(self.get(i) for i in range(16))

455

454

456

455

457

def _build_trie(index):

456

def _build_trie(index):

458

"""build a nodemap trie

457

"""build a nodemap trie

459

458

460

The nodemap stores revision number for each unique prefix.

459

The nodemap stores revision number for each unique prefix.

461

460

462

Each block is a dictionary with keys in `[0, 15]`. Values are either

461

Each block is a dictionary with keys in `[0, 15]`. Values are either

463

another block or a revision number.

462

another block or a revision number.

464

"""

463

"""

465

root = Block()

464

root = Block()

466

for rev in range(len(index)):

465

for rev in range(len(index)):

467

hex = nodemod.hex(index[rev][7])

466

hex = nodemod.hex(index[rev][7])

468

_insert_into_block(index, 0, root, rev, hex)

467

_insert_into_block(index, 0, root, rev, hex)

469

return root

468

return root

470

469

471

470

472

def _update_trie(index, root, last_rev):

471

def _update_trie(index, root, last_rev):

473

"""consume"""

472

"""consume"""

474

changed = 0

473

changed = 0

475

for rev in range(last_rev + 1, len(index)):

474

for rev in range(last_rev + 1, len(index)):

476

hex = nodemod.hex(index[rev][7])

475

hex = nodemod.hex(index[rev][7])

477

changed += _insert_into_block(index, 0, root, rev, hex)

476

changed += _insert_into_block(index, 0, root, rev, hex)

478

return changed, root

477

return changed, root

479

478

480

479

481

def _insert_into_block(index, level, block, current_rev, current_hex):

480

def _insert_into_block(index, level, block, current_rev, current_hex):

482

"""insert a new revision in a block

481

"""insert a new revision in a block

483

482

484

index: the index we are adding revision for

483

index: the index we are adding revision for

485

level: the depth of the current block in the trie

484

level: the depth of the current block in the trie

486

block: the block currently being considered

485

block: the block currently being considered

487

current_rev: the revision number we are adding

486

current_rev: the revision number we are adding

488

current_hex: the hexadecimal representation of the of that revision

487

current_hex: the hexadecimal representation of the of that revision

489

"""

488

"""

490

changed = 1

489

changed = 1

491

if block.ondisk_id is not None:

490

if block.ondisk_id is not None:

492

block.ondisk_id = None

491

block.ondisk_id = None

493

hex_digit = _to_int(current_hex[level : level + 1])

492

hex_digit = _to_int(current_hex[level : level + 1])

494

entry = block.get(hex_digit)

493

entry = block.get(hex_digit)

495

if entry is None:

494

if entry is None:

496

# no entry, simply store the revision number

495

# no entry, simply store the revision number

497

block[hex_digit] = current_rev

496

block[hex_digit] = current_rev

498

elif isinstance(entry, dict):

497

elif isinstance(entry, dict):

499

# need to recurse to an underlying block

498

# need to recurse to an underlying block

500

changed += _insert_into_block(

499

changed += _insert_into_block(

501

index, level + 1, entry, current_rev, current_hex

500

index, level + 1, entry, current_rev, current_hex

502

)

501

)

503

else:

502

else:

504

# collision with a previously unique prefix, inserting new

503

# collision with a previously unique prefix, inserting new

505

# vertices to fit both entry.

504

# vertices to fit both entry.

506

other_hex = nodemod.hex(index[entry][7])

505

other_hex = nodemod.hex(index[entry][7])

507

other_rev = entry

506

other_rev = entry

508

new = Block()

507

new = Block()

509

block[hex_digit] = new

508

block[hex_digit] = new

510

_insert_into_block(index, level + 1, new, other_rev, other_hex)

509

_insert_into_block(index, level + 1, new, other_rev, other_hex)

511

_insert_into_block(index, level + 1, new, current_rev, current_hex)

510

_insert_into_block(index, level + 1, new, current_rev, current_hex)

512

return changed

511

return changed

513

512

514

513

515

def _persist_trie(root, existing_idx=None):

514

def _persist_trie(root, existing_idx=None):

516

"""turn a nodemap trie into persistent binary data

515

"""turn a nodemap trie into persistent binary data

517

516

518

See `_build_trie` for nodemap trie structure"""

517

See `_build_trie` for nodemap trie structure"""

519

block_map = {}

518

block_map = {}

520

if existing_idx is not None:

519

if existing_idx is not None:

521

base_idx = existing_idx + 1

520

base_idx = existing_idx + 1

522

else:

521

else:

523

base_idx = 0

522

base_idx = 0

524

chunks = []

523

chunks = []

525

for tn in _walk_trie(root):

524

for tn in _walk_trie(root):

526

if tn.ondisk_id is not None:

525

if tn.ondisk_id is not None:

527

block_map[id(tn)] = tn.ondisk_id

526

block_map[id(tn)] = tn.ondisk_id

528

else:

527

else:

529

block_map[id(tn)] = len(chunks) + base_idx

528

block_map[id(tn)] = len(chunks) + base_idx

530

chunks.append(_persist_block(tn, block_map))

529

chunks.append(_persist_block(tn, block_map))

531

return b''.join(chunks)

530

return b''.join(chunks)

532

531

533

532

534

def _walk_trie(block):

533

def _walk_trie(block):

535

"""yield all the block in a trie

534

"""yield all the block in a trie

536

535

537

Children blocks are always yield before their parent block.

536

Children blocks are always yield before their parent block.

538

"""

537

"""

539

for (__, item) in sorted(block.items()):

538

for (__, item) in sorted(block.items()):

540

if isinstance(item, dict):

539

if isinstance(item, dict):

541

for sub_block in _walk_trie(item):

540

for sub_block in _walk_trie(item):

542

yield sub_block

541

yield sub_block

543

yield block

542

yield block

544

543

545

544

546

def _persist_block(block_node, block_map):

545

def _persist_block(block_node, block_map):

547

"""produce persistent binary data for a single block

546

"""produce persistent binary data for a single block

548

547

549

Children block are assumed to be already persisted and present in

548

Children block are assumed to be already persisted and present in

550

block_map.

549

block_map.

551

"""

550

"""

552

data = tuple(_to_value(v, block_map) for v in block_node)

551

data = tuple(_to_value(v, block_map) for v in block_node)

553

return S_BLOCK.pack(*data)

552

return S_BLOCK.pack(*data)

554

553

555

554

556

def _to_value(item, block_map):

555

def _to_value(item, block_map):

557

"""persist any value as an integer"""

556

"""persist any value as an integer"""

558

if item is None:

557

if item is None:

559

return NO_ENTRY

558

return NO_ENTRY

560

elif isinstance(item, dict):

559

elif isinstance(item, dict):

561

return block_map[id(item)]

560

return block_map[id(item)]

562

else:

561

else:

563

return _transform_rev(item)

562

return _transform_rev(item)

564

563

565

564

566

def parse_data(data):

565

def parse_data(data):

567

"""parse parse nodemap data into a nodemap Trie"""

566

"""parse parse nodemap data into a nodemap Trie"""

568

if (len(data) % S_BLOCK.size) != 0:

567

if (len(data) % S_BLOCK.size) != 0:

569

msg = "nodemap data size is not a multiple of block size (%d): %d"

568

msg = "nodemap data size is not a multiple of block size (%d): %d"

570

raise error.Abort(msg % (S_BLOCK.size, len(data)))

569

raise error.Abort(msg % (S_BLOCK.size, len(data)))

571

if not data:

570

if not data:

572

return Block(), None

571

return Block(), None

573

block_map = {}

572

block_map = {}

574

new_blocks = []

573

new_blocks = []

575

for i in range(0, len(data), S_BLOCK.size):

574

for i in range(0, len(data), S_BLOCK.size):

576

block = Block()

575

block = Block()

577

block.ondisk_id = len(block_map)

576

block.ondisk_id = len(block_map)

578

block_map[block.ondisk_id] = block

577

block_map[block.ondisk_id] = block

579

block_data = data[i : i + S_BLOCK.size]

578

block_data = data[i : i + S_BLOCK.size]

580

values = S_BLOCK.unpack(block_data)

579

values = S_BLOCK.unpack(block_data)

581

new_blocks.append((block, values))

580

new_blocks.append((block, values))

582

for b, values in new_blocks:

581

for b, values in new_blocks:

583

for idx, v in enumerate(values):

582

for idx, v in enumerate(values):

584

if v == NO_ENTRY:

583

if v == NO_ENTRY:

585

continue

584

continue

586

elif v >= 0:

585

elif v >= 0:

587

b[idx] = block_map[v]

586

b[idx] = block_map[v]

588

else:

587

else:

589

b[idx] = _transform_rev(v)

588

b[idx] = _transform_rev(v)

590

return block, i // S_BLOCK.size

589

return block, i // S_BLOCK.size

591

590

592

591

593

# debug utility

592

# debug utility

594

593

595

594

596

def check_data(ui, index, data):

595

def check_data(ui, index, data):

597

"""verify that the provided nodemap data are valid for the given idex"""

596

"""verify that the provided nodemap data are valid for the given idex"""

598

ret = 0

597

ret = 0

599

ui.status((b"revision in index: %d\n") % len(index))

598

ui.status((b"revision in index: %d\n") % len(index))

600

root, __ = parse_data(data)

599

root, __ = parse_data(data)

601

all_revs = set(_all_revisions(root))

600

all_revs = set(_all_revisions(root))

602

ui.status((b"revision in nodemap: %d\n") % len(all_revs))

601

ui.status((b"revision in nodemap: %d\n") % len(all_revs))

603

for r in range(len(index)):

602

for r in range(len(index)):

604

if r not in all_revs:

603

if r not in all_revs:

605

msg = b" revision missing from nodemap: %d\n" % r

604

msg = b" revision missing from nodemap: %d\n" % r

606

ui.write_err(msg)

605

ui.write_err(msg)

607

ret = 1

606

ret = 1

608

else:

607

else:

609

all_revs.remove(r)

608

all_revs.remove(r)

610

nm_rev = _find_node(root, nodemod.hex(index[r][7]))

609

nm_rev = _find_node(root, nodemod.hex(index[r][7]))

611

if nm_rev is None:

610

if nm_rev is None:

612

msg = b" revision node does not match any entries: %d\n" % r

611

msg = b" revision node does not match any entries: %d\n" % r

613

ui.write_err(msg)

612

ui.write_err(msg)

614

ret = 1

613

ret = 1

615

elif nm_rev != r:

614

elif nm_rev != r:

616

msg = (

615

msg = (

617

b" revision node does not match the expected revision: "

616

b" revision node does not match the expected revision: "

618

b"%d != %d\n" % (r, nm_rev)

617

b"%d != %d\n" % (r, nm_rev)

619

)

618

)

620

ui.write_err(msg)

619

ui.write_err(msg)

621

ret = 1

620

ret = 1

622

621

623

if all_revs:

622

if all_revs:

624

for r in sorted(all_revs):

623

for r in sorted(all_revs):

625

msg = b" extra revision in nodemap: %d\n" % r

624

msg = b" extra revision in nodemap: %d\n" % r

626

ui.write_err(msg)

625

ui.write_err(msg)

627

ret = 1

626

ret = 1

628

return ret

627

return ret

629

628

630

629

631

def _all_revisions(root):

630

def _all_revisions(root):

632

"""return all revisions stored in a Trie"""

631

"""return all revisions stored in a Trie"""

633

for block in _walk_trie(root):

632

for block in _walk_trie(root):

634

for v in block:

633

for v in block:

635

if v is None or isinstance(v, Block):

634

if v is None or isinstance(v, Block):

636

continue

635

continue

637

yield v

636

yield v

638

637

639

638

640

def _find_node(block, node):

639

def _find_node(block, node):

641

"""find the revision associated with a given node"""

640

"""find the revision associated with a given node"""

642

entry = block.get(_to_int(node[0:1]))

641

entry = block.get(_to_int(node[0:1]))

643

if isinstance(entry, dict):

642

if isinstance(entry, dict):

644

return _find_node(entry, node[1:])

643

return _find_node(entry, node[1:])

645

return entry

644

return entry

	Site-wide shortcuts
/	Use quick search box
g h	Goto home page
g g	Goto my private gists page
g G	Goto my public gists page
g 0-9	Goto bookmarked items from 0-9
n r	New repository page
n g	New gist page

	Repositories
g s	Goto summary page
g c	Goto changelog page
g f	Goto files page
g F	Goto files page with file search activated
g p	Goto pull requests page
g o	Goto repository settings
g O	Goto repository access permissions settings
t s	Toggle sidebar on some pages

             # nodemap.py - nodemap related code and utilities
             #
             # Copyright 2019 Pierre-Yves David <pierre-yves.david@octobus.net>
             # Copyright 2019 George Racinet <georges.racinet@octobus.net>
             #
             # This software may be used and distributed according to the terms of the
             # GNU General Public License version 2 or any later version.
             from __future__ import absolute_import
             import errno
             import os
             import re
             import struct
             from ..i18n import _
             from .. import (
                 error,
                 node as nodemod,
                 util,
             )
             class NodeMap(dict):
                 def __missing__(self, x):
                     raise error.RevlogError(b'unknown node: %s' % x)
             def persisted_data(revlog):
                 """read the nodemap for a revlog from disk"""
                 if revlog.nodemap_file is None:
                     return None
                 pdata = revlog.opener.tryread(revlog.nodemap_file)
                 if not pdata:
                     return None
                 offset = 0
                 (version,) = S_VERSION.unpack(pdata[offset : offset + S_VERSION.size])
                 if version != ONDISK_VERSION:
                     return None
                 offset += S_VERSION.size
                 headers = S_HEADER.unpack(pdata[offset : offset + S_HEADER.size])
                 uid_size, tip_rev, data_length, data_unused, tip_node_size = headers
                 offset += S_HEADER.size
                 docket = NodeMapDocket(pdata[offset : offset + uid_size])
                 offset += uid_size
                 docket.tip_rev = tip_rev
                 docket.tip_node = pdata[offset : offset + tip_node_size]
                 docket.data_length = data_length
                 docket.data_unused = data_unused
                 filename = _rawdata_filepath(revlog, docket)
                 use_mmap = revlog.opener.options.get(b"exp-persistent-nodemap.mmap")
                 try:
                     with revlog.opener(filename) as fd:
                         if use_mmap:
                             data = util.buffer(util.mmapread(fd, data_length))
                         else:
                             data = fd.read(data_length)
                 except OSError as e:
                     if e.errno != errno.ENOENT:
                         raise
                 if len(data) < data_length:
                     return None
                 return docket, data
             def setup_persistent_nodemap(tr, revlog):
                 """Install whatever is needed transaction side to persist a nodemap on disk
                 (only actually persist the nodemap if this is relevant for this revlog)
                 """
                 if revlog._inline:
                     return  # inlined revlog are too small for this to be relevant
                 if revlog.nodemap_file is None:
                     return  # we do not use persistent_nodemap on this revlog
                 # we need to happen after the changelog finalization, in that use "cl-"
                 callback_id = b"nm-revlog-persistent-nodemap-%s" % revlog.nodemap_file
                 if tr.hasfinalize(callback_id):
                     return  # no need to register again
                 tr.addpending(
                     callback_id, lambda tr: _persist_nodemap(tr, revlog, pending=True)
                 )
                 tr.addfinalize(callback_id, lambda tr: _persist_nodemap(tr, revlog))
             class _NoTransaction(object):
                 """transaction like object to update the nodemap outside a transaction
                 """
                 def __init__(self):
                     self._postclose = {}
                 def addpostclose(self, callback_id, callback_func):
                     self._postclose[callback_id] = callback_func
                 def registertmp(self, *args, **kwargs):
                     pass
                 def addbackup(self, *args, **kwargs):
                     pass
                 def add(self, *args, **kwargs):
                     pass
                 def addabort(self, *args, **kwargs):
                     pass
                 def _report(self, *args):
                     pass
             def update_persistent_nodemap(revlog):
                 """update the persistent nodemap right now
                 To be used for updating the nodemap on disk outside of a normal transaction
                 setup (eg, `debugupdatecache`).
                 """
                 if revlog._inline:
                     return  # inlined revlog are too small for this to be relevant
                 if revlog.nodemap_file is None:
                     return  # we do not use persistent_nodemap on this revlog
                 notr = _NoTransaction()
                 _persist_nodemap(notr, revlog)
                 for k in sorted(notr._postclose):
                     notr._postclose[k](None)
             def _persist_nodemap(tr, revlog, pending=False):
                 """Write nodemap data on disk for a given revlog
                 """
                 if getattr(revlog, 'filteredrevs', ()):
                     raise error.ProgrammingError(
                         "cannot persist nodemap of a filtered changelog"
                     )
                 if revlog.nodemap_file is None:
                     msg = "calling persist nodemap on a revlog without the feature enableb"
                     raise error.ProgrammingError(msg)
                 can_incremental = util.safehasattr(revlog.index, "nodemap_data_incremental")
                 ondisk_docket = revlog._nodemap_docket
                 feed_data = util.safehasattr(revlog.index, "update_nodemap_data")
                 use_mmap = revlog.opener.options.get(b"exp-persistent-nodemap.mmap")
                 mode = revlog.opener.options.get(b"exp-persistent-nodemap.mode")
                 if not can_incremental:
                     msg = _(b"persistent nodemap in strict mode without efficient method")
                     if mode == b'warn':
                         tr._report(b"%s\n" % msg)
                     elif mode == b'strict':
                         raise error.Abort(msg)
                 data = None
                 # first attemp an incremental update of the data
                 if can_incremental and ondisk_docket is not None:
                     target_docket = revlog._nodemap_docket.copy()
                     (
                         src_docket,
                         data_changed_count,
                         data,
                     ) = revlog.index.nodemap_data_incremental()
                     new_length = target_docket.data_length + len(data)
                     new_unused = target_docket.data_unused + data_changed_count
                     if src_docket != target_docket:
                         data = None
                     elif new_length <= (new_unused * 10):  # under 10% of unused data
                         data = None
                     else:
                         datafile = _rawdata_filepath(revlog, target_docket)
                         # EXP-TODO: if this is a cache, this should use a cache vfs, not a
                         # store vfs
                         tr.add(datafile, target_docket.data_length)
                         with revlog.opener(datafile, b'r+') as fd:
                             fd.seek(target_docket.data_length)
                             fd.write(data)
                             if feed_data:
                                 if use_mmap:
                                     fd.seek(0)
                                     new_data = fd.read(new_length)
                                 else:
                                     fd.flush()
                                     new_data = util.buffer(util.mmapread(fd, new_length))
                         target_docket.data_length = new_length
                         target_docket.data_unused = new_unused
                 if data is None:
                     # otherwise fallback to a full new export
                     target_docket = NodeMapDocket()
                     datafile = _rawdata_filepath(revlog, target_docket)
                     if util.safehasattr(revlog.index, "nodemap_data_all"):
                         data = revlog.index.nodemap_data_all()
                     else:
                         data = persistent_data(revlog.index)
                     # EXP-TODO: if this is a cache, this should use a cache vfs, not a
                     # store vfs
                     tryunlink = revlog.opener.tryunlink
                     def abortck(tr):
                         tryunlink(datafile)
                     callback_id = b"delete-%s" % datafile
                     # some flavor of the transaction abort does not cleanup new file, it
                     # simply empty them.
                     tr.addabort(callback_id, abortck)
                     with revlog.opener(datafile, b'w+') as fd:
                         fd.write(data)
                         if feed_data:
                             if use_mmap:
                                 new_data = data
                             else:
                                 fd.flush()
                                 new_data = util.buffer(util.mmapread(fd, len(data)))
                     target_docket.data_length = len(data)
                 target_docket.tip_rev = revlog.tiprev()
                 target_docket.tip_node = revlog.node(target_docket.tip_rev)
                 # EXP-TODO: if this is a cache, this should use a cache vfs, not a
                 # store vfs
                 file_path = revlog.nodemap_file
                 if pending:
                     file_path += b'.a'
                     tr.registertmp(file_path)
                 else:
                     tr.addbackup(file_path)
                 with revlog.opener(file_path, b'w', atomictemp=True) as fp:
                     fp.write(target_docket.serialize())
                 revlog._nodemap_docket = target_docket
                 if feed_data:
                     revlog.index.update_nodemap_data(target_docket, new_data)
                 # search for old index file in all cases, some older process might have
                 # left one behind.
                 olds = _other_rawdata_filepath(revlog, target_docket)
                 if olds:
                     realvfs = getattr(revlog, '_realopener', revlog.opener)
                     def cleanup(tr):
                         for oldfile in olds:
                             realvfs.tryunlink(oldfile)
                     callback_id = b"revlog-cleanup-nodemap-%s" % revlog.nodemap_file
                     tr.addpostclose(callback_id, cleanup)
             ### Nodemap docket file
             #
             # The nodemap data are stored on disk using 2 files:
             #
             # * a raw data files containing a persistent nodemap
             #   (see `Nodemap Trie` section)
             #
             # * a small "docket" file containing medatadata
             #
             # While the nodemap data can be multiple tens of megabytes, the "docket" is
             # small, it is easy to update it automatically or to duplicated its content
             # during a transaction.
             #
             # Multiple raw data can exist at the same time (The currently valid one and a
             # new one beind used by an in progress transaction). To accomodate this, the
             # filename hosting the raw data has a variable parts. The exact filename is
             # specified inside the "docket" file.
             #
             # The docket file contains information to find, qualify and validate the raw
             # data. Its content is currently very light, but it will expand as the on disk
             # nodemap gains the necessary features to be used in production.
-            # version 0 is experimental, no BC garantee, do no use outside of tests.
+            ONDISK_VERSION = 1
-            ONDISK_VERSION = 0
             S_VERSION = struct.Struct(">B")
             S_HEADER = struct.Struct(">BQQQQ")
             ID_SIZE = 8
             def _make_uid():
                 """return a new unique identifier.
                 The identifier is random and composed of ascii characters."""
                 return nodemod.hex(os.urandom(ID_SIZE))
             class NodeMapDocket(object):
                 """metadata associated with persistent nodemap data
                 The persistent data may come from disk or be on their way to disk.
                 """
                 def __init__(self, uid=None):
                     if uid is None:
                         uid = _make_uid()
                     # a unique identifier for the data file:
                     #   - When new data are appended, it is preserved.
                     #   - When a new data file is created, a new identifier is generated.
                     self.uid = uid
                     # the tipmost revision stored in the data file. This revision and all
                     # revision before it are expected to be encoded in the data file.
                     self.tip_rev = None
                     # the node of that tipmost revision, if it mismatch the current index
                     # data the docket is not valid for the current index and should be
                     # discarded.
                     #
                     # note: this method is not perfect as some destructive operation could
                     # preserve the same tip_rev + tip_node while altering lower revision.
                     # However this multiple other caches have the same vulnerability (eg:
                     # brancmap cache).
                     self.tip_node = None
                     # the size (in bytes) of the persisted data to encode the nodemap valid
                     # for `tip_rev`.
                     #   - data file shorter than this are corrupted,
                     #   - any extra data should be ignored.
                     self.data_length = None
                     # the amount (in bytes) of "dead" data, still in the data file but no
                     # longer used for the nodemap.
                     self.data_unused = 0
                 def copy(self):
                     new = NodeMapDocket(uid=self.uid)
                     new.tip_rev = self.tip_rev
                     new.tip_node = self.tip_node
                     new.data_length = self.data_length
                     new.data_unused = self.data_unused
                     return new
                 def __cmp__(self, other):
                     if self.uid < other.uid:
                         return -1
                     if self.uid > other.uid:
                         return 1
                     elif self.data_length < other.data_length:
                         return -1
                     elif self.data_length > other.data_length:
                         return 1
                     return 0
                 def __eq__(self, other):
                     return self.uid == other.uid and self.data_length == other.data_length
                 def serialize(self):
                     """return serialized bytes for a docket using the passed uid"""
                     data = []
                     data.append(S_VERSION.pack(ONDISK_VERSION))
                     headers = (
                         len(self.uid),
                         self.tip_rev,
                         self.data_length,
                         self.data_unused,
                         len(self.tip_node),
                     )
                     data.append(S_HEADER.pack(*headers))
                     data.append(self.uid)
                     data.append(self.tip_node)
                     return b''.join(data)
             def _rawdata_filepath(revlog, docket):
                 """The (vfs relative) nodemap's rawdata file for a given uid"""
                 if revlog.nodemap_file.endswith(b'.n.a'):
                     prefix = revlog.nodemap_file[:-4]
                 else:
                     prefix = revlog.nodemap_file[:-2]
                 return b"%s-%s.nd" % (prefix, docket.uid)
             def _other_rawdata_filepath(revlog, docket):
                 prefix = revlog.nodemap_file[:-2]
                 pattern = re.compile(br"(^|/)%s-[0-9a-f]+\.nd$" % prefix)
                 new_file_path = _rawdata_filepath(revlog, docket)
                 new_file_name = revlog.opener.basename(new_file_path)
                 dirpath = revlog.opener.dirname(new_file_path)
                 others = []
                 for f in revlog.opener.listdir(dirpath):
                     if pattern.match(f) and f != new_file_name:
                         others.append(f)
                 return others
             ### Nodemap Trie
             #
             # This is a simple reference implementation to compute and persist a nodemap
             # trie. This reference implementation is write only. The python version of this
             # is not expected to be actually used, since it wont provide performance
             # improvement over existing non-persistent C implementation.
             #
             # The nodemap is persisted as Trie using 4bits-address/16-entries block. each
             # revision can be adressed using its node shortest prefix.
             #
             # The trie is stored as a sequence of block. Each block contains 16 entries
             # (signed 64bit integer, big endian). Each entry can be one of the following:
             #
             #  * value >=  0 -> index of sub-block
             #  * value == -1 -> no value
             #  * value <  -1 -> a revision value: rev = -(value+10)
             #
             # The implementation focus on simplicity, not on performance. A Rust
             # implementation should provide a efficient version of the same binary
             # persistence. This reference python implementation is never meant to be
             # extensively use in production.
             def persistent_data(index):
                 """return the persistent binary form for a nodemap for a given index
                 """
                 trie = _build_trie(index)
                 return _persist_trie(trie)
             def update_persistent_data(index, root, max_idx, last_rev):
                 """return the incremental update for persistent nodemap from a given index
                 """
                 changed_block, trie = _update_trie(index, root, last_rev)
                 return (
                     changed_block * S_BLOCK.size,
                     _persist_trie(trie, existing_idx=max_idx),
                 )
             S_BLOCK = struct.Struct(">" + ("l" * 16))
             NO_ENTRY = -1
             # rev 0 need to be -2 because 0 is used by block, -1 is a special value.
             REV_OFFSET = 2
             def _transform_rev(rev):
                 """Return the number used to represent the rev in the tree.
                 (or retrieve a rev number from such representation)
                 Note that this is an involution, a function equal to its inverse (i.e.
                 which gives the identity when applied to itself).
                 """
                 return -(rev + REV_OFFSET)
             def _to_int(hex_digit):
                 """turn an hexadecimal digit into a proper integer"""
                 return int(hex_digit, 16)
             class Block(dict):
                 """represent a block of the Trie
                 contains up to 16 entry indexed from 0 to 15"""
                 def __init__(self):
                     super(Block, self).__init__()
                     # If this block exist on disk, here is its ID
                     self.ondisk_id = None
                 def __iter__(self):
                     return iter(self.get(i) for i in range(16))
             def _build_trie(index):
                 """build a nodemap trie
                 The nodemap stores revision number for each unique prefix.
                 Each block is a dictionary with keys in `[0, 15]`. Values are either
                 another block or a revision number.
                 """
                 root = Block()
                 for rev in range(len(index)):
                     hex = nodemod.hex(index[rev][7])
                     _insert_into_block(index, 0, root, rev, hex)
                 return root
             def _update_trie(index, root, last_rev):
                 """consume"""
                 changed = 0
                 for rev in range(last_rev + 1, len(index)):
                     hex = nodemod.hex(index[rev][7])
                     changed += _insert_into_block(index, 0, root, rev, hex)
                 return changed, root
             def _insert_into_block(index, level, block, current_rev, current_hex):
                 """insert a new revision in a block
                 index: the index we are adding revision for
                 level: the depth of the current block in the trie
                 block: the block currently being considered
                 current_rev: the revision number we are adding
                 current_hex: the hexadecimal representation of the of that revision
                 """
                 changed = 1
                 if block.ondisk_id is not None:
                     block.ondisk_id = None
                 hex_digit = _to_int(current_hex[level : level + 1])
                 entry = block.get(hex_digit)
                 if entry is None:
                     # no entry, simply store the revision number
                     block[hex_digit] = current_rev
                 elif isinstance(entry, dict):
                     # need to recurse to an underlying block
                     changed += _insert_into_block(
                         index, level + 1, entry, current_rev, current_hex
                     )
                 else:
                     # collision with a previously unique prefix, inserting new
                     # vertices to fit both entry.
                     other_hex = nodemod.hex(index[entry][7])
                     other_rev = entry
                     new = Block()
                     block[hex_digit] = new
                     _insert_into_block(index, level + 1, new, other_rev, other_hex)
                     _insert_into_block(index, level + 1, new, current_rev, current_hex)
                 return changed
             def _persist_trie(root, existing_idx=None):
                 """turn a nodemap trie into persistent binary data
                 See `_build_trie` for nodemap trie structure"""
                 block_map = {}
                 if existing_idx is not None:
                     base_idx = existing_idx + 1
                 else:
                     base_idx = 0
                 chunks = []
                 for tn in _walk_trie(root):
                     if tn.ondisk_id is not None:
                         block_map[id(tn)] = tn.ondisk_id
                     else:
                         block_map[id(tn)] = len(chunks) + base_idx
                         chunks.append(_persist_block(tn, block_map))
                 return b''.join(chunks)
             def _walk_trie(block):
                 """yield all the block in a trie
                 Children blocks are always yield before their parent block.
                 """
                 for (__, item) in sorted(block.items()):
                     if isinstance(item, dict):
                         for sub_block in _walk_trie(item):
                             yield sub_block
                 yield block
             def _persist_block(block_node, block_map):
                 """produce persistent binary data for a single block
                 Children block are assumed to be already persisted and present in
                 block_map.
                 """
                 data = tuple(_to_value(v, block_map) for v in block_node)
                 return S_BLOCK.pack(*data)
             def _to_value(item, block_map):
                 """persist any value as an integer"""
                 if item is None:
                     return NO_ENTRY
                 elif isinstance(item, dict):
                     return block_map[id(item)]
                 else:
                     return _transform_rev(item)
             def parse_data(data):
                 """parse parse nodemap data into a nodemap Trie"""
                 if (len(data) % S_BLOCK.size) != 0:
                     msg = "nodemap data size is not a multiple of block size (%d): %d"
                     raise error.Abort(msg % (S_BLOCK.size, len(data)))
                 if not data:
                     return Block(), None
                 block_map = {}
                 new_blocks = []
                 for i in range(0, len(data), S_BLOCK.size):
                     block = Block()
                     block.ondisk_id = len(block_map)
                     block_map[block.ondisk_id] = block
                     block_data = data[i : i + S_BLOCK.size]
                     values = S_BLOCK.unpack(block_data)
                     new_blocks.append((block, values))
                 for b, values in new_blocks:
                     for idx, v in enumerate(values):
                         if v == NO_ENTRY:
                             continue
                         elif v >= 0:
                             b[idx] = block_map[v]
                         else:
                             b[idx] = _transform_rev(v)
                 return block, i // S_BLOCK.size
             # debug utility
             def check_data(ui, index, data):
                 """verify that the provided nodemap data are valid for the given idex"""
                 ret = 0
                 ui.status((b"revision in index:   %d\n") % len(index))
                 root, __ = parse_data(data)
                 all_revs = set(_all_revisions(root))
                 ui.status((b"revision in nodemap: %d\n") % len(all_revs))
                 for r in range(len(index)):
                     if r not in all_revs:
                         msg = b"  revision missing from nodemap: %d\n" % r
                         ui.write_err(msg)
                         ret = 1
                     else:
                         all_revs.remove(r)
                     nm_rev = _find_node(root, nodemod.hex(index[r][7]))
                     if nm_rev is None:
                         msg = b"  revision node does not match any entries: %d\n" % r
                         ui.write_err(msg)
                         ret = 1
                     elif nm_rev != r:
                         msg = (
                             b"  revision node does not match the expected revision: "
                             b"%d != %d\n" % (r, nm_rev)
                         )
                         ui.write_err(msg)
                         ret = 1
                 if all_revs:
                     for r in sorted(all_revs):
                         msg = b"  extra revision in  nodemap: %d\n" % r
                         ui.write_err(msg)
                     ret = 1
                 return ret
             def _all_revisions(root):
                 """return all revisions stored in a Trie"""
                 for block in _walk_trie(root):
                     for v in block:
                         if v is None or isinstance(v, Block):
                             continue
                         yield v
             def _find_node(block, node):
                 """find the revision associated with a given node"""
                 entry = block.get(_to_int(node[0:1]))
                 if isinstance(entry, dict):
                     return _find_node(entry, node[1:])
                 return entry