upstream/mercurial-mirror Commit - r51912:66c139d3

1

# censor code related to censoring revision

1

# censor code related to censoring revision

2

# coding: utf8

2

# coding: utf8

3

#

3

#

4

5

6

#

6

#

7

# This software may be used and distributed according to the terms of the

7

# This software may be used and distributed according to the terms of the

8

# GNU General Public License version 2 or any later version.

8

# GNU General Public License version 2 or any later version.

9

10

import binascii

10

import binascii

11

import contextlib

11

import contextlib

12

import os

12

import os

13

import struct

13

import struct

14

15

from ..node import (

15

from ..node import (

16

nullrev,

16

nullrev,

17

)

17

)

18

from .constants import (

18

from .constants import (

19

COMP_MODE_PLAIN,

19

COMP_MODE_PLAIN,

20

ENTRY_DATA_COMPRESSED_LENGTH,

20

ENTRY_DATA_COMPRESSED_LENGTH,

21

ENTRY_DATA_COMPRESSION_MODE,

21

ENTRY_DATA_COMPRESSION_MODE,

22

ENTRY_DATA_OFFSET,

22

ENTRY_DATA_OFFSET,

23

ENTRY_DATA_UNCOMPRESSED_LENGTH,

23

ENTRY_DATA_UNCOMPRESSED_LENGTH,

24

ENTRY_DELTA_BASE,

24

ENTRY_DELTA_BASE,

25

ENTRY_LINK_REV,

25

ENTRY_LINK_REV,

26

ENTRY_NODE_ID,

26

ENTRY_NODE_ID,

27

ENTRY_PARENT_1,

27

ENTRY_PARENT_1,

28

ENTRY_PARENT_2,

28

ENTRY_PARENT_2,

29

ENTRY_SIDEDATA_COMPRESSED_LENGTH,

29

ENTRY_SIDEDATA_COMPRESSED_LENGTH,

30

ENTRY_SIDEDATA_COMPRESSION_MODE,

30

ENTRY_SIDEDATA_COMPRESSION_MODE,

31

ENTRY_SIDEDATA_OFFSET,

31

ENTRY_SIDEDATA_OFFSET,

32

REVIDX_ISCENSORED,

32

REVIDX_ISCENSORED,

33

REVLOGV0,

33

REVLOGV0,

34

REVLOGV1,

34

REVLOGV1,

35

)

35

)

36

from ..i18n import _

36

from ..i18n import _

37

38

from .. import (

38

from .. import (

39

error,

39

error,

40

mdiff,

40

mdiff,

41

pycompat,

41

pycompat,

42

revlogutils,

42

revlogutils,

43

util,

43

util,

44

)

44

)

45

from ..utils import (

45

from ..utils import (

46

storageutil,

46

storageutil,

47

)

47

)

48

from . import (

48

from . import (

49

constants,

49

constants,

50

deltas,

50

deltas,

51

)

51

)

52

53

54

def v1_censor(rl, tr, censornode, tombstone=b''):

54

def v1_censor(rl, tr, censornode, tombstone=b''):

55

"""censors a revision in a "version 1" revlog"""

55

"""censors a revision in a "version 1" revlog"""

56

assert rl._format_version == constants.REVLOGV1, rl._format_version

56

assert rl._format_version == constants.REVLOGV1, rl._format_version

57

58

# avoid cycle

58

# avoid cycle

59

from .. import revlog

59

from .. import revlog

60

61

censorrev = rl.rev(censornode)

61

censorrev = rl.rev(censornode)

62

tombstone = storageutil.packmeta({b'censored': tombstone}, b'')

62

tombstone = storageutil.packmeta({b'censored': tombstone}, b'')

63

64

# Rewriting the revlog in place is hard. Our strategy for censoring is

64

# Rewriting the revlog in place is hard. Our strategy for censoring is

65

# to create a new revlog, copy all revisions to it, then replace the

65

# to create a new revlog, copy all revisions to it, then replace the

66

# revlogs on transaction close.

66

# revlogs on transaction close.

67

#

67

#

68

# This is a bit dangerous. We could easily have a mismatch of state.

68

# This is a bit dangerous. We could easily have a mismatch of state.

69

newrl = revlog.revlog(

69

newrl = revlog.revlog(

70

rl.opener,

70

rl.opener,

71

target=rl.target,

71

target=rl.target,

72

radix=rl.radix,

72

radix=rl.radix,

73

postfix=b'tmpcensored',

73

postfix=b'tmpcensored',

74

censorable=True,

74

censorable=True,

75

)

75

)

76

newrl._format_version = rl._format_version

76

newrl._format_version = rl._format_version

77

newrl._format_flags = rl._format_flags

77

newrl._format_flags = rl._format_flags

78

newrl._generaldelta = rl._generaldelta

78

newrl._generaldelta = rl._generaldelta

79

newrl._parse_index = rl._parse_index

79

newrl._parse_index = rl._parse_index

80

81

for rev in rl.revs():

81

for rev in rl.revs():

82

node = rl.node(rev)

82

node = rl.node(rev)

83

p1, p2 = rl.parents(node)

83

p1, p2 = rl.parents(node)

84

85

if rev == censorrev:

85

if rev == censorrev:

86

newrl.addrawrevision(

86

newrl.addrawrevision(

87

tombstone,

87

tombstone,

88

tr,

88

tr,

89

rl.linkrev(censorrev),

89

rl.linkrev(censorrev),

90

p1,

90

p1,

91

p2,

91

p2,

92

censornode,

92

censornode,

93

constants.REVIDX_ISCENSORED,

93

constants.REVIDX_ISCENSORED,

94

)

94

)

95

96

if newrl.deltaparent(rev) != nullrev:

96

if newrl.deltaparent(rev) != nullrev:

97

m = _(b'censored revision stored as delta; cannot censor')

97

m = _(b'censored revision stored as delta; cannot censor')

98

h = _(

98

h = _(

99

b'censoring of revlogs is not fully implemented;'

99

b'censoring of revlogs is not fully implemented;'

100

b' please report this bug'

100

b' please report this bug'

101

)

101

)

102

raise error.Abort(m, hint=h)

102

raise error.Abort(m, hint=h)

103

continue

103

continue

104

105

if rl.iscensored(rev):

105

if rl.iscensored(rev):

106

if rl.deltaparent(rev) != nullrev:

106

if rl.deltaparent(rev) != nullrev:

107

m = _(

107

m = _(

108

b'cannot censor due to censored '

108

b'cannot censor due to censored '

109

b'revision having delta stored'

109

b'revision having delta stored'

110

)

110

)

111

raise error.Abort(m)

111

raise error.Abort(m)

112

rawtext = rl._chunk(rev)

112

rawtext = rl._chunk(rev)

113

else:

113

else:

114

rawtext = rl.rawdata(rev)

114

rawtext = rl.rawdata(rev)

115

116

newrl.addrawrevision(

116

newrl.addrawrevision(

117

rawtext, tr, rl.linkrev(rev), p1, p2, node, rl.flags(rev)

117

rawtext, tr, rl.linkrev(rev), p1, p2, node, rl.flags(rev)

118

)

118

)

119

120

tr.addbackup(rl._indexfile, location=b'store')

120

tr.addbackup(rl._indexfile, location=b'store')

121

if not rl._inline:

121

if not rl._inline:

122

tr.addbackup(rl._datafile, location=b'store')

122

tr.addbackup(rl._datafile, location=b'store')

123

124

rl.opener.rename(newrl._indexfile, rl._indexfile)

124

rl.opener.rename(newrl._indexfile, rl._indexfile)

125

if not rl._inline:

125

if not rl._inline:

126

rl.opener.rename(newrl._datafile, rl._datafile)

126

rl.opener.rename(newrl._datafile, rl._datafile)

127

128

rl.clearcaches()

128

rl.clearcaches()

129

rl._loadindex()

129

rl._loadindex()

130

131

132

def v2_censor(revlog, tr, censornode, tombstone=b''):

132

def v2_censor(revlog, tr, censornode, tombstone=b''):

133

"""censors a revision in a "version 2" revlog"""

133

"""censors a revision in a "version 2" revlog"""

134

assert revlog._format_version != REVLOGV0, revlog._format_version

134

assert revlog._format_version != REVLOGV0, revlog._format_version

135

assert revlog._format_version != REVLOGV1, revlog._format_version

135

assert revlog._format_version != REVLOGV1, revlog._format_version

136

137

censor_revs = {revlog.rev(censornode)}

137

censor_revs = {revlog.rev(censornode)}

138

_rewrite_v2(revlog, tr, censor_revs, tombstone)

138

_rewrite_v2(revlog, tr, censor_revs, tombstone)

139

140

141

def _rewrite_v2(revlog, tr, censor_revs, tombstone=b''):

141

def _rewrite_v2(revlog, tr, censor_revs, tombstone=b''):

142

"""rewrite a revlog to censor some of its content

142

"""rewrite a revlog to censor some of its content

143

144

General principle

144

General principle

145

146

We create new revlog files (index/data/sidedata) to copy the content of

146

We create new revlog files (index/data/sidedata) to copy the content of

147

the existing data without the censored data.

147

the existing data without the censored data.

148

149

We need to recompute new delta for any revision that used the censored

149

We need to recompute new delta for any revision that used the censored

150

revision as delta base. As the cumulative size of the new delta may be

150

revision as delta base. As the cumulative size of the new delta may be

151

large, we store them in a temporary file until they are stored in their

151

large, we store them in a temporary file until they are stored in their

152

final destination.

152

final destination.

153

154

All data before the censored data can be blindly copied. The rest needs

154

All data before the censored data can be blindly copied. The rest needs

155

to be copied as we go and the associated index entry needs adjustement.

155

to be copied as we go and the associated index entry needs adjustement.

156

"""

156

"""

157

assert revlog._format_version != REVLOGV0, revlog._format_version

157

assert revlog._format_version != REVLOGV0, revlog._format_version

158

assert revlog._format_version != REVLOGV1, revlog._format_version

158

assert revlog._format_version != REVLOGV1, revlog._format_version

159

160

old_index = revlog.index

160

old_index = revlog.index

161

docket = revlog._docket

161

docket = revlog._docket

162

163

tombstone = storageutil.packmeta({b'censored': tombstone}, b'')

163

tombstone = storageutil.packmeta({b'censored': tombstone}, b'')

164

165

first_excl_rev = min(censor_revs)

165

first_excl_rev = min(censor_revs)

166

167

first_excl_entry = revlog.index[first_excl_rev]

167

first_excl_entry = revlog.index[first_excl_rev]

168

index_cutoff = revlog.index.entry_size * first_excl_rev

168

index_cutoff = revlog.index.entry_size * first_excl_rev

169

data_cutoff = first_excl_entry[ENTRY_DATA_OFFSET] >> 16

169

data_cutoff = first_excl_entry[ENTRY_DATA_OFFSET] >> 16

170

sidedata_cutoff = revlog.sidedata_cut_off(first_excl_rev)

170

sidedata_cutoff = revlog.sidedata_cut_off(first_excl_rev)

171

172

with pycompat.unnamedtempfile(mode=b"w+b") as tmp_storage:

172

with pycompat.unnamedtempfile(mode=b"w+b") as tmp_storage:

173

# rev → (new_base, data_start, data_end, compression_mode)

173

# rev → (new_base, data_start, data_end, compression_mode)

174

rewritten_entries = _precompute_rewritten_delta(

174

rewritten_entries = _precompute_rewritten_delta(

175

revlog,

175

revlog,

176

old_index,

176

old_index,

177

censor_revs,

177

censor_revs,

178

tmp_storage,

178

tmp_storage,

179

)

179

)

180

181

all_files = _setup_new_files(

181

all_files = _setup_new_files(

182

revlog,

182

revlog,

183

index_cutoff,

183

index_cutoff,

184

data_cutoff,

184

data_cutoff,

185

sidedata_cutoff,

185

sidedata_cutoff,

186

)

186

)

187

188

# we dont need to open the old index file since its content already

188

# we dont need to open the old index file since its content already

189

# exist in a usable form in `old_index`.

189

# exist in a usable form in `old_index`.

190

with all_files() as open_files:

190

with all_files() as open_files:

191

(

191

(

192

old_data_file,

192

old_data_file,

193

old_sidedata_file,

193

old_sidedata_file,

194

new_index_file,

194

new_index_file,

195

new_data_file,

195

new_data_file,

196

new_sidedata_file,

196

new_sidedata_file,

197

) = open_files

197

) = open_files

198

199

# writing the censored revision

199

# writing the censored revision

200

201

# Writing all subsequent revisions

201

# Writing all subsequent revisions

202

for rev in range(first_excl_rev, len(old_index)):

202

for rev in range(first_excl_rev, len(old_index)):

203

if rev in censor_revs:

203

if rev in censor_revs:

204

_rewrite_censor(

204

_rewrite_censor(

205

revlog,

205

revlog,

206

old_index,

206

old_index,

207

open_files,

207

open_files,

208

rev,

208

rev,

209

tombstone,

209

tombstone,

210

)

210

)

211

else:

211

else:

212

_rewrite_simple(

212

_rewrite_simple(

213

revlog,

213

revlog,

214

old_index,

214

old_index,

215

open_files,

215

open_files,

216

rev,

216

rev,

217

rewritten_entries,

217

rewritten_entries,

218

tmp_storage,

218

tmp_storage,

219

)

219

)

220

docket.write(transaction=None, stripping=True)

220

docket.write(transaction=None, stripping=True)

221

222

223

def _precompute_rewritten_delta(

223

def _precompute_rewritten_delta(

224

revlog,

224

revlog,

225

old_index,

225

old_index,

226

excluded_revs,

226

excluded_revs,

227

tmp_storage,

227

tmp_storage,

228

):

228

):

229

"""Compute new delta for revisions whose delta is based on revision that

229

"""Compute new delta for revisions whose delta is based on revision that

230

will not survive as is.

230

will not survive as is.

231

232

Return a mapping: {rev → (new_base, data_start, data_end, compression_mode)}

232

Return a mapping: {rev → (new_base, data_start, data_end, compression_mode)}

233

"""

233

"""

234

dc = deltas.deltacomputer(revlog)

234

dc = deltas.deltacomputer(revlog)

235

rewritten_entries = {}

235

rewritten_entries = {}

236

first_excl_rev = min(excluded_revs)

236

first_excl_rev = min(excluded_revs)

237

with revlog._segmentfile._open_read() as dfh:

237

with revlog.reading(), revlog._segmentfile._open_read() as dfh:

238

for rev in range(first_excl_rev, len(old_index)):

238

for rev in range(first_excl_rev, len(old_index)):

239

if rev in excluded_revs:

239

if rev in excluded_revs:

240

# this revision will be preserved as is, so we don't need to

240

# this revision will be preserved as is, so we don't need to

241

# consider recomputing a delta.

241

# consider recomputing a delta.

242

continue

242

continue

243

entry = old_index[rev]

243

entry = old_index[rev]

244

if entry[ENTRY_DELTA_BASE] not in excluded_revs:

244

if entry[ENTRY_DELTA_BASE] not in excluded_revs:

245

continue

245

continue

246

# This is a revision that use the censored revision as the base

246

# This is a revision that use the censored revision as the base

247

# for its delta. We need a need new deltas

247

# for its delta. We need a need new deltas

248

if entry[ENTRY_DATA_UNCOMPRESSED_LENGTH] == 0:

248

if entry[ENTRY_DATA_UNCOMPRESSED_LENGTH] == 0:

249

# this revision is empty, we can delta against nullrev

249

# this revision is empty, we can delta against nullrev

250

rewritten_entries[rev] = (nullrev, 0, 0, COMP_MODE_PLAIN)

250

rewritten_entries[rev] = (nullrev, 0, 0, COMP_MODE_PLAIN)

251

else:

251

else:

252

253

text = revlog.rawdata(rev, ~~_df~~=~~dfh~~)

253

text = revlog.rawdata(rev)

254

info = revlogutils.revisioninfo(

254

info = revlogutils.revisioninfo(

255

node=entry[ENTRY_NODE_ID],

255

node=entry[ENTRY_NODE_ID],

256

p1=revlog.node(entry[ENTRY_PARENT_1]),

256

p1=revlog.node(entry[ENTRY_PARENT_1]),

257

p2=revlog.node(entry[ENTRY_PARENT_2]),

257

p2=revlog.node(entry[ENTRY_PARENT_2]),

258

btext=[text],

258

btext=[text],

259

textlen=len(text),

259

textlen=len(text),

260

cachedelta=None,

260

cachedelta=None,

261

flags=entry[ENTRY_DATA_OFFSET] & 0xFFFF,

261

flags=entry[ENTRY_DATA_OFFSET] & 0xFFFF,

262

)

262

)

263

d = dc.finddeltainfo(

263

d = dc.finddeltainfo(

264

info, dfh, excluded_bases=excluded_revs, target_rev=rev

264

info, dfh, excluded_bases=excluded_revs, target_rev=rev

265

)

265

)

266

default_comp = revlog._docket.default_compression_header

266

default_comp = revlog._docket.default_compression_header

267

comp_mode, d = deltas.delta_compression(default_comp, d)

267

comp_mode, d = deltas.delta_compression(default_comp, d)

268

# using `tell` is a bit lazy, but we are not here for speed

268

# using `tell` is a bit lazy, but we are not here for speed

269

start = tmp_storage.tell()

269

start = tmp_storage.tell()

270

tmp_storage.write(d.data[1])

270

tmp_storage.write(d.data[1])

271

end = tmp_storage.tell()

271

end = tmp_storage.tell()

272

rewritten_entries[rev] = (d.base, start, end, comp_mode)

272

rewritten_entries[rev] = (d.base, start, end, comp_mode)

273

return rewritten_entries

273

return rewritten_entries

274

275

276

def _setup_new_files(

276

def _setup_new_files(

277

revlog,

277

revlog,

278

index_cutoff,

278

index_cutoff,

279

data_cutoff,

279

data_cutoff,

280

sidedata_cutoff,

280

sidedata_cutoff,

281

):

281

):

282

"""

282

"""

283

284

return a context manager to open all the relevant files:

284

return a context manager to open all the relevant files:

285

- old_data_file,

285

- old_data_file,

286

- old_sidedata_file,

286

- old_sidedata_file,

287

- new_index_file,

287

- new_index_file,

288

- new_data_file,

288

- new_data_file,

289

- new_sidedata_file,

289

- new_sidedata_file,

290

291

The old_index_file is not here because it is accessed through the

291

The old_index_file is not here because it is accessed through the

292

`old_index` object if the caller function.

292

`old_index` object if the caller function.

293

"""

293

"""

294

docket = revlog._docket

294

docket = revlog._docket

295

old_index_filepath = revlog.opener.join(docket.index_filepath())

295

old_index_filepath = revlog.opener.join(docket.index_filepath())

296

old_data_filepath = revlog.opener.join(docket.data_filepath())

296

old_data_filepath = revlog.opener.join(docket.data_filepath())

297

old_sidedata_filepath = revlog.opener.join(docket.sidedata_filepath())

297

old_sidedata_filepath = revlog.opener.join(docket.sidedata_filepath())

298

299

new_index_filepath = revlog.opener.join(docket.new_index_file())

299

new_index_filepath = revlog.opener.join(docket.new_index_file())

300

new_data_filepath = revlog.opener.join(docket.new_data_file())

300

new_data_filepath = revlog.opener.join(docket.new_data_file())

301

new_sidedata_filepath = revlog.opener.join(docket.new_sidedata_file())

301

new_sidedata_filepath = revlog.opener.join(docket.new_sidedata_file())

302

303

util.copyfile(old_index_filepath, new_index_filepath, nb_bytes=index_cutoff)

303

util.copyfile(old_index_filepath, new_index_filepath, nb_bytes=index_cutoff)

304

util.copyfile(old_data_filepath, new_data_filepath, nb_bytes=data_cutoff)

304

util.copyfile(old_data_filepath, new_data_filepath, nb_bytes=data_cutoff)

305

util.copyfile(

305

util.copyfile(

306

old_sidedata_filepath,

306

old_sidedata_filepath,

307

new_sidedata_filepath,

307

new_sidedata_filepath,

308

nb_bytes=sidedata_cutoff,

308

nb_bytes=sidedata_cutoff,

309

)

309

)

310

revlog.opener.register_file(docket.index_filepath())

310

revlog.opener.register_file(docket.index_filepath())

311

revlog.opener.register_file(docket.data_filepath())

311

revlog.opener.register_file(docket.data_filepath())

312

revlog.opener.register_file(docket.sidedata_filepath())

312

revlog.opener.register_file(docket.sidedata_filepath())

313

314

docket.index_end = index_cutoff

314

docket.index_end = index_cutoff

315

docket.data_end = data_cutoff

315

docket.data_end = data_cutoff

316

docket.sidedata_end = sidedata_cutoff

316

docket.sidedata_end = sidedata_cutoff

317

318

# reload the revlog internal information

318

# reload the revlog internal information

319

revlog.clearcaches()

319

revlog.clearcaches()

320

revlog._loadindex(docket=docket)

320

revlog._loadindex(docket=docket)

321

322

@contextlib.contextmanager

322

@contextlib.contextmanager

323

def all_files_opener():

323

def all_files_opener():

324

# hide opening in an helper function to please check-code, black

324

# hide opening in an helper function to please check-code, black

325

# and various python version at the same time

325

# and various python version at the same time

326

with open(old_data_filepath, 'rb') as old_data_file:

326

with open(old_data_filepath, 'rb') as old_data_file:

327

with open(old_sidedata_filepath, 'rb') as old_sidedata_file:

327

with open(old_sidedata_filepath, 'rb') as old_sidedata_file:

328

with open(new_index_filepath, 'r+b') as new_index_file:

328

with open(new_index_filepath, 'r+b') as new_index_file:

329

with open(new_data_filepath, 'r+b') as new_data_file:

329

with open(new_data_filepath, 'r+b') as new_data_file:

330

with open(

330

with open(

331

new_sidedata_filepath, 'r+b'

331

new_sidedata_filepath, 'r+b'

332

) as new_sidedata_file:

332

) as new_sidedata_file:

333

new_index_file.seek(0, os.SEEK_END)

333

new_index_file.seek(0, os.SEEK_END)

334

assert new_index_file.tell() == index_cutoff

334

assert new_index_file.tell() == index_cutoff

335

new_data_file.seek(0, os.SEEK_END)

335

new_data_file.seek(0, os.SEEK_END)

336

assert new_data_file.tell() == data_cutoff

336

assert new_data_file.tell() == data_cutoff

337

new_sidedata_file.seek(0, os.SEEK_END)

337

new_sidedata_file.seek(0, os.SEEK_END)

338

assert new_sidedata_file.tell() == sidedata_cutoff

338

assert new_sidedata_file.tell() == sidedata_cutoff

339

yield (

339

yield (

340

old_data_file,

340

old_data_file,

341

old_sidedata_file,

341

old_sidedata_file,

342

new_index_file,

342

new_index_file,

343

new_data_file,

343

new_data_file,

344

new_sidedata_file,

344

new_sidedata_file,

345

)

345

)

346

347

return all_files_opener

347

return all_files_opener

348

349

350

def _rewrite_simple(

350

def _rewrite_simple(

351

revlog,

351

revlog,

352

old_index,

352

old_index,

353

all_files,

353

all_files,

354

rev,

354

rev,

355

rewritten_entries,

355

rewritten_entries,

356

tmp_storage,

356

tmp_storage,

357

):

357

):

358

"""append a normal revision to the index after the rewritten one(s)"""

358

"""append a normal revision to the index after the rewritten one(s)"""

359

(

359

(

360

old_data_file,

360

old_data_file,

361

old_sidedata_file,

361

old_sidedata_file,

362

new_index_file,

362

new_index_file,

363

new_data_file,

363

new_data_file,

364

new_sidedata_file,

364

new_sidedata_file,

365

) = all_files

365

) = all_files

366

entry = old_index[rev]

366

entry = old_index[rev]

367

flags = entry[ENTRY_DATA_OFFSET] & 0xFFFF

367

flags = entry[ENTRY_DATA_OFFSET] & 0xFFFF

368

old_data_offset = entry[ENTRY_DATA_OFFSET] >> 16

368

old_data_offset = entry[ENTRY_DATA_OFFSET] >> 16

369

370

if rev not in rewritten_entries:

370

if rev not in rewritten_entries:

371

old_data_file.seek(old_data_offset)

371

old_data_file.seek(old_data_offset)

372

new_data_size = entry[ENTRY_DATA_COMPRESSED_LENGTH]

372

new_data_size = entry[ENTRY_DATA_COMPRESSED_LENGTH]

373

new_data = old_data_file.read(new_data_size)

373

new_data = old_data_file.read(new_data_size)

374

data_delta_base = entry[ENTRY_DELTA_BASE]

374

data_delta_base = entry[ENTRY_DELTA_BASE]

375

d_comp_mode = entry[ENTRY_DATA_COMPRESSION_MODE]

375

d_comp_mode = entry[ENTRY_DATA_COMPRESSION_MODE]

376

else:

376

else:

377

(

377

(

378

data_delta_base,

378

data_delta_base,

379

start,

379

start,

380

end,

380

end,

381

d_comp_mode,

381

d_comp_mode,

382

) = rewritten_entries[rev]

382

) = rewritten_entries[rev]

383

new_data_size = end - start

383

new_data_size = end - start

384

tmp_storage.seek(start)

384

tmp_storage.seek(start)

385

new_data = tmp_storage.read(new_data_size)

385

new_data = tmp_storage.read(new_data_size)

386

387

# It might be faster to group continuous read/write operation,

387

# It might be faster to group continuous read/write operation,

388

# however, this is censor, an operation that is not focussed

388

# however, this is censor, an operation that is not focussed

389

# around stellar performance. So I have not written this

389

# around stellar performance. So I have not written this

390

# optimisation yet.

390

# optimisation yet.

391

new_data_offset = new_data_file.tell()

391

new_data_offset = new_data_file.tell()

392

new_data_file.write(new_data)

392

new_data_file.write(new_data)

393

394

sidedata_size = entry[ENTRY_SIDEDATA_COMPRESSED_LENGTH]

394

sidedata_size = entry[ENTRY_SIDEDATA_COMPRESSED_LENGTH]

395

new_sidedata_offset = new_sidedata_file.tell()

395

new_sidedata_offset = new_sidedata_file.tell()

396

if 0 < sidedata_size:

396

if 0 < sidedata_size:

397

old_sidedata_offset = entry[ENTRY_SIDEDATA_OFFSET]

397

old_sidedata_offset = entry[ENTRY_SIDEDATA_OFFSET]

398

old_sidedata_file.seek(old_sidedata_offset)

398

old_sidedata_file.seek(old_sidedata_offset)

399

new_sidedata = old_sidedata_file.read(sidedata_size)

399

new_sidedata = old_sidedata_file.read(sidedata_size)

400

new_sidedata_file.write(new_sidedata)

400

new_sidedata_file.write(new_sidedata)

401

402

data_uncompressed_length = entry[ENTRY_DATA_UNCOMPRESSED_LENGTH]

402

data_uncompressed_length = entry[ENTRY_DATA_UNCOMPRESSED_LENGTH]

403

sd_com_mode = entry[ENTRY_SIDEDATA_COMPRESSION_MODE]

403

sd_com_mode = entry[ENTRY_SIDEDATA_COMPRESSION_MODE]

404

assert data_delta_base <= rev, (data_delta_base, rev)

404

assert data_delta_base <= rev, (data_delta_base, rev)

405

406

new_entry = revlogutils.entry(

406

new_entry = revlogutils.entry(

407

flags=flags,

407

flags=flags,

408

data_offset=new_data_offset,

408

data_offset=new_data_offset,

409

data_compressed_length=new_data_size,

409

data_compressed_length=new_data_size,

410

data_uncompressed_length=data_uncompressed_length,

410

data_uncompressed_length=data_uncompressed_length,

411

data_delta_base=data_delta_base,

411

data_delta_base=data_delta_base,

412

link_rev=entry[ENTRY_LINK_REV],

412

link_rev=entry[ENTRY_LINK_REV],

413

parent_rev_1=entry[ENTRY_PARENT_1],

413

parent_rev_1=entry[ENTRY_PARENT_1],

414

parent_rev_2=entry[ENTRY_PARENT_2],

414

parent_rev_2=entry[ENTRY_PARENT_2],

415

node_id=entry[ENTRY_NODE_ID],

415

node_id=entry[ENTRY_NODE_ID],

416

sidedata_offset=new_sidedata_offset,

416

sidedata_offset=new_sidedata_offset,

417

sidedata_compressed_length=sidedata_size,

417

sidedata_compressed_length=sidedata_size,

418

data_compression_mode=d_comp_mode,

418

data_compression_mode=d_comp_mode,

419

sidedata_compression_mode=sd_com_mode,

419

sidedata_compression_mode=sd_com_mode,

420

)

420

)

421

revlog.index.append(new_entry)

421

revlog.index.append(new_entry)

422

entry_bin = revlog.index.entry_binary(rev)

422

entry_bin = revlog.index.entry_binary(rev)

423

new_index_file.write(entry_bin)

423

new_index_file.write(entry_bin)

424

425

revlog._docket.index_end = new_index_file.tell()

425

revlog._docket.index_end = new_index_file.tell()

426

revlog._docket.data_end = new_data_file.tell()

426

revlog._docket.data_end = new_data_file.tell()

427

revlog._docket.sidedata_end = new_sidedata_file.tell()

427

revlog._docket.sidedata_end = new_sidedata_file.tell()

428

429

430

def _rewrite_censor(

430

def _rewrite_censor(

431

revlog,

431

revlog,

432

old_index,

432

old_index,

433

all_files,

433

all_files,

434

rev,

434

rev,

435

tombstone,

435

tombstone,

436

):

436

):

437

"""rewrite and append a censored revision"""

437

"""rewrite and append a censored revision"""

438

(

438

(

439

old_data_file,

439

old_data_file,

440

old_sidedata_file,

440

old_sidedata_file,

441

new_index_file,

441

new_index_file,

442

new_data_file,

442

new_data_file,

443

new_sidedata_file,

443

new_sidedata_file,

444

) = all_files

444

) = all_files

445

entry = old_index[rev]

445

entry = old_index[rev]

446

447

# XXX consider trying the default compression too

447

# XXX consider trying the default compression too

448

new_data_size = len(tombstone)

448

new_data_size = len(tombstone)

449

new_data_offset = new_data_file.tell()

449

new_data_offset = new_data_file.tell()

450

new_data_file.write(tombstone)

450

new_data_file.write(tombstone)

451

452

# we are not adding any sidedata as they might leak info about the censored version

452

# we are not adding any sidedata as they might leak info about the censored version

453

454

link_rev = entry[ENTRY_LINK_REV]

454

link_rev = entry[ENTRY_LINK_REV]

455

456

p1 = entry[ENTRY_PARENT_1]

456

p1 = entry[ENTRY_PARENT_1]

457

p2 = entry[ENTRY_PARENT_2]

457

p2 = entry[ENTRY_PARENT_2]

458

459

new_entry = revlogutils.entry(

459

new_entry = revlogutils.entry(

460

flags=constants.REVIDX_ISCENSORED,

460

flags=constants.REVIDX_ISCENSORED,

461

data_offset=new_data_offset,

461

data_offset=new_data_offset,

462

data_compressed_length=new_data_size,

462

data_compressed_length=new_data_size,

463

data_uncompressed_length=new_data_size,

463

data_uncompressed_length=new_data_size,

464

data_delta_base=rev,

464

data_delta_base=rev,

465

link_rev=link_rev,

465

link_rev=link_rev,

466

parent_rev_1=p1,

466

parent_rev_1=p1,

467

parent_rev_2=p2,

467

parent_rev_2=p2,

468

node_id=entry[ENTRY_NODE_ID],

468

node_id=entry[ENTRY_NODE_ID],

469

sidedata_offset=0,

469

sidedata_offset=0,

470

sidedata_compressed_length=0,

470

sidedata_compressed_length=0,

471

data_compression_mode=COMP_MODE_PLAIN,

471

data_compression_mode=COMP_MODE_PLAIN,

472

sidedata_compression_mode=COMP_MODE_PLAIN,

472

sidedata_compression_mode=COMP_MODE_PLAIN,

473

)

473

)

474

revlog.index.append(new_entry)

474

revlog.index.append(new_entry)

475

entry_bin = revlog.index.entry_binary(rev)

475

entry_bin = revlog.index.entry_binary(rev)

476

new_index_file.write(entry_bin)

476

new_index_file.write(entry_bin)

477

revlog._docket.index_end = new_index_file.tell()

477

revlog._docket.index_end = new_index_file.tell()

478

revlog._docket.data_end = new_data_file.tell()

478

revlog._docket.data_end = new_data_file.tell()

479

480

481

def _get_filename_from_filelog_index(path):

481

def _get_filename_from_filelog_index(path):

482

# Drop the extension and the `data/` prefix

482

# Drop the extension and the `data/` prefix

483

path_part = path.rsplit(b'.', 1)[0].split(b'/', 1)

483

path_part = path.rsplit(b'.', 1)[0].split(b'/', 1)

484

if len(path_part) < 2:

484

if len(path_part) < 2:

485

msg = _(b"cannot recognize filelog from filename: '%s'")

485

msg = _(b"cannot recognize filelog from filename: '%s'")

486

msg %= path

486

msg %= path

487

raise error.Abort(msg)

487

raise error.Abort(msg)

488

489

return path_part[1]

489

return path_part[1]

490

491

492

def _filelog_from_filename(repo, path):

492

def _filelog_from_filename(repo, path):

493

"""Returns the filelog for the given `path`. Stolen from `engine.py`"""

493

"""Returns the filelog for the given `path`. Stolen from `engine.py`"""

494

495

from .. import filelog # avoid cycle

495

from .. import filelog # avoid cycle

496

497

fl = filelog.filelog(repo.svfs, path)

497

fl = filelog.filelog(repo.svfs, path)

498

return fl

498

return fl

499

500

501

def _write_swapped_parents(repo, rl, rev, offset, fp):

501

def _write_swapped_parents(repo, rl, rev, offset, fp):

502

"""Swaps p1 and p2 and overwrites the revlog entry for `rev` in `fp`"""

502

"""Swaps p1 and p2 and overwrites the revlog entry for `rev` in `fp`"""

503

from ..pure import parsers # avoid cycle

503

from ..pure import parsers # avoid cycle

504

505

if repo._currentlock(repo._lockref) is None:

505

if repo._currentlock(repo._lockref) is None:

506

# Let's be paranoid about it

506

# Let's be paranoid about it

507

msg = "repo needs to be locked to rewrite parents"

507

msg = "repo needs to be locked to rewrite parents"

508

raise error.ProgrammingError(msg)

508

raise error.ProgrammingError(msg)

509

510

index_format = parsers.IndexObject.index_format

510

index_format = parsers.IndexObject.index_format

511

entry = rl.index[rev]

511

entry = rl.index[rev]

512

new_entry = list(entry)

512

new_entry = list(entry)

513

new_entry[5], new_entry[6] = entry[6], entry[5]

513

new_entry[5], new_entry[6] = entry[6], entry[5]

514

packed = index_format.pack(*new_entry[:8])

514

packed = index_format.pack(*new_entry[:8])

515

fp.seek(offset)

515

fp.seek(offset)

516

fp.write(packed)

516

fp.write(packed)

517

518

519

def _reorder_filelog_parents(repo, fl, to_fix):

519

def _reorder_filelog_parents(repo, fl, to_fix):

520

"""

520

"""

521

Swaps p1 and p2 for all `to_fix` revisions of filelog `fl` and writes the

521

Swaps p1 and p2 for all `to_fix` revisions of filelog `fl` and writes the

522

new version to disk, overwriting the old one with a rename.

522

new version to disk, overwriting the old one with a rename.

523

"""

523

"""

524

from ..pure import parsers # avoid cycle

524

from ..pure import parsers # avoid cycle

525

526

ui = repo.ui

526

ui = repo.ui

527

assert len(to_fix) > 0

527

assert len(to_fix) > 0

528

rl = fl._revlog

528

rl = fl._revlog

529

if rl._format_version != constants.REVLOGV1:

529

if rl._format_version != constants.REVLOGV1:

530

msg = "expected version 1 revlog, got version '%d'" % rl._format_version

530

msg = "expected version 1 revlog, got version '%d'" % rl._format_version

531

raise error.ProgrammingError(msg)

531

raise error.ProgrammingError(msg)

532

533

index_file = rl._indexfile

533

index_file = rl._indexfile

534

new_file_path = index_file + b'.tmp-parents-fix'

534

new_file_path = index_file + b'.tmp-parents-fix'

535

repaired_msg = _(b"repaired revision %d of 'filelog %s'\n")

535

repaired_msg = _(b"repaired revision %d of 'filelog %s'\n")

536

537

with ui.uninterruptible():

537

with ui.uninterruptible():

538

try:

538

try:

539

util.copyfile(

539

util.copyfile(

540

rl.opener.join(index_file),

540

rl.opener.join(index_file),

541

rl.opener.join(new_file_path),

541

rl.opener.join(new_file_path),

542

checkambig=rl._checkambig,

542

checkambig=rl._checkambig,

543

)

543

)

544

545

with rl.opener(new_file_path, mode=b"r+") as fp:

545

with rl.opener(new_file_path, mode=b"r+") as fp:

546

if rl._inline:

546

if rl._inline:

547

index = parsers.InlinedIndexObject(fp.read())

547

index = parsers.InlinedIndexObject(fp.read())

548

for rev in fl.revs():

548

for rev in fl.revs():

549

if rev in to_fix:

549

if rev in to_fix:

550

offset = index._calculate_index(rev)

550

offset = index._calculate_index(rev)

551

_write_swapped_parents(repo, rl, rev, offset, fp)

551

_write_swapped_parents(repo, rl, rev, offset, fp)

552

ui.write(repaired_msg % (rev, index_file))

552

ui.write(repaired_msg % (rev, index_file))

553

else:

553

else:

554

index_format = parsers.IndexObject.index_format

554

index_format = parsers.IndexObject.index_format

555

for rev in to_fix:

555

for rev in to_fix:

556

offset = rev * index_format.size

556

offset = rev * index_format.size

557

_write_swapped_parents(repo, rl, rev, offset, fp)

557

_write_swapped_parents(repo, rl, rev, offset, fp)

558

ui.write(repaired_msg % (rev, index_file))

558

ui.write(repaired_msg % (rev, index_file))

559

560

rl.opener.rename(new_file_path, index_file)

560

rl.opener.rename(new_file_path, index_file)

561

rl.clearcaches()

561

rl.clearcaches()

562

rl._loadindex()

562

rl._loadindex()

563

finally:

563

finally:

564

util.tryunlink(new_file_path)

564

util.tryunlink(new_file_path)

565

566

567

def _is_revision_affected(fl, filerev, metadata_cache=None):

567

def _is_revision_affected(fl, filerev, metadata_cache=None):

568

full_text = lambda: fl._revlog.rawdata(filerev)

568

full_text = lambda: fl._revlog.rawdata(filerev)

569

parent_revs = lambda: fl._revlog.parentrevs(filerev)

569

parent_revs = lambda: fl._revlog.parentrevs(filerev)

570

return _is_revision_affected_inner(

570

return _is_revision_affected_inner(

571

full_text, parent_revs, filerev, metadata_cache

571

full_text, parent_revs, filerev, metadata_cache

572

)

572

)

573

574

575

def _is_revision_affected_inner(

575

def _is_revision_affected_inner(

576

full_text,

576

full_text,

577

parents_revs,

577

parents_revs,

578

filerev,

578

filerev,

579

metadata_cache=None,

579

metadata_cache=None,

580

):

580

):

581

"""Mercurial currently (5.9rc0) uses `p1 == nullrev and p2 != nullrev` as a

581

"""Mercurial currently (5.9rc0) uses `p1 == nullrev and p2 != nullrev` as a

582

special meaning compared to the reverse in the context of filelog-based

582

special meaning compared to the reverse in the context of filelog-based

583

copytracing. issue6528 exists because new code assumed that parent ordering

583

copytracing. issue6528 exists because new code assumed that parent ordering

584

didn't matter, so this detects if the revision contains metadata (since

584

didn't matter, so this detects if the revision contains metadata (since

585

it's only used for filelog-based copytracing) and its parents are in the

585

it's only used for filelog-based copytracing) and its parents are in the

586

"wrong" order."""

586

"wrong" order."""

587

try:

587

try:

588

raw_text = full_text()

588

raw_text = full_text()

589

except error.CensoredNodeError:

589

except error.CensoredNodeError:

590

# We don't care about censored nodes as they never carry metadata

590

# We don't care about censored nodes as they never carry metadata

591

return False

591

return False

592

593

# raw text can be a `memoryview`, which doesn't implement `startswith`

593

# raw text can be a `memoryview`, which doesn't implement `startswith`

594

has_meta = bytes(raw_text[:2]) == b'\x01\n'

594

has_meta = bytes(raw_text[:2]) == b'\x01\n'

595

if metadata_cache is not None:

595

if metadata_cache is not None:

596

metadata_cache[filerev] = has_meta

596

metadata_cache[filerev] = has_meta

597

if has_meta:

597

if has_meta:

598

(p1, p2) = parents_revs()

598

(p1, p2) = parents_revs()

599

if p1 != nullrev and p2 == nullrev:

599

if p1 != nullrev and p2 == nullrev:

600

return True

600

return True

601

return False

601

return False

602

603

604

def _is_revision_affected_fast(repo, fl, filerev, metadata_cache):

604

def _is_revision_affected_fast(repo, fl, filerev, metadata_cache):

605

rl = fl._revlog

605

rl = fl._revlog

606

is_censored = lambda: rl.iscensored(filerev)

606

is_censored = lambda: rl.iscensored(filerev)

607

delta_base = lambda: rl.deltaparent(filerev)

607

delta_base = lambda: rl.deltaparent(filerev)

608

delta = lambda: rl._chunk(filerev)

608

delta = lambda: rl._chunk(filerev)

609

full_text = lambda: rl.rawdata(filerev)

609

full_text = lambda: rl.rawdata(filerev)

610

parent_revs = lambda: rl.parentrevs(filerev)

610

parent_revs = lambda: rl.parentrevs(filerev)

611

return _is_revision_affected_fast_inner(

611

return _is_revision_affected_fast_inner(

612

is_censored,

612

is_censored,

613

delta_base,

613

delta_base,

614

delta,

614

delta,

615

full_text,

615

full_text,

616

parent_revs,

616

parent_revs,

617

filerev,

617

filerev,

618

metadata_cache,

618

metadata_cache,

619

)

619

)

620

621

622

def _is_revision_affected_fast_inner(

622

def _is_revision_affected_fast_inner(

623

is_censored,

623

is_censored,

624

delta_base,

624

delta_base,

625

delta,

625

delta,

626

full_text,

626

full_text,

627

parent_revs,

627

parent_revs,

628

filerev,

628

filerev,

629

metadata_cache,

629

metadata_cache,

630

):

630

):

631

"""Optimization fast-path for `_is_revision_affected`.

631

"""Optimization fast-path for `_is_revision_affected`.

632

633

`metadata_cache` is a dict of `{rev: has_metadata}` which allows any

633

`metadata_cache` is a dict of `{rev: has_metadata}` which allows any

634

revision to check if its base has metadata, saving computation of the full

634

revision to check if its base has metadata, saving computation of the full

635

text, instead looking at the current delta.

635

text, instead looking at the current delta.

636

637

This optimization only works if the revisions are looked at in order."""

637

This optimization only works if the revisions are looked at in order."""

638

639

if is_censored():

639

if is_censored():

640

# Censored revisions don't contain metadata, so they cannot be affected

640

# Censored revisions don't contain metadata, so they cannot be affected

641

metadata_cache[filerev] = False

641

metadata_cache[filerev] = False

642

return False

642

return False

643

644

p1, p2 = parent_revs()

644

p1, p2 = parent_revs()

645

if p1 == nullrev or p2 != nullrev:

645

if p1 == nullrev or p2 != nullrev:

646

return False

646

return False

647

648

delta_parent = delta_base()

648

delta_parent = delta_base()

649

parent_has_metadata = metadata_cache.get(delta_parent)

649

parent_has_metadata = metadata_cache.get(delta_parent)

650

if parent_has_metadata is None:

650

if parent_has_metadata is None:

651

return _is_revision_affected_inner(

651

return _is_revision_affected_inner(

652

full_text,

652

full_text,

653

parent_revs,

653

parent_revs,

654

filerev,

654

filerev,

655

metadata_cache,

655

metadata_cache,

656

)

656

)

657

658

chunk = delta()

658

chunk = delta()

659

if not len(chunk):

659

if not len(chunk):

660

# No diff for this revision

660

# No diff for this revision

661

return parent_has_metadata

661

return parent_has_metadata

662

663

header_length = 12

663

header_length = 12

664

if len(chunk) < header_length:

664

if len(chunk) < header_length:

665

raise error.Abort(_(b"patch cannot be decoded"))

665

raise error.Abort(_(b"patch cannot be decoded"))

666

667

start, _end, _length = struct.unpack(b">lll", chunk[:header_length])

667

start, _end, _length = struct.unpack(b">lll", chunk[:header_length])

668

669

if start < 2: # len(b'\x01\n') == 2

669

if start < 2: # len(b'\x01\n') == 2

670

# This delta does *something* to the metadata marker (if any).

670

# This delta does *something* to the metadata marker (if any).

671

# Check it the slow way

671

# Check it the slow way

672

is_affected = _is_revision_affected_inner(

672

is_affected = _is_revision_affected_inner(

673

full_text,

673

full_text,

674

parent_revs,

674

parent_revs,

675

filerev,

675

filerev,

676

metadata_cache,

676

metadata_cache,

677

)

677

)

678

return is_affected

678

return is_affected

679

680

# The diff did not remove or add the metadata header, it's then in the same

680

# The diff did not remove or add the metadata header, it's then in the same

681

# situation as its parent

681

# situation as its parent

682

metadata_cache[filerev] = parent_has_metadata

682

metadata_cache[filerev] = parent_has_metadata

683

return parent_has_metadata

683

return parent_has_metadata

684

685

686

def _from_report(ui, repo, context, from_report, dry_run):

686

def _from_report(ui, repo, context, from_report, dry_run):

687

"""

687

"""

688

Fix the revisions given in the `from_report` file, but still checks if the

688

Fix the revisions given in the `from_report` file, but still checks if the

689

revisions are indeed affected to prevent an unfortunate cyclic situation

689

revisions are indeed affected to prevent an unfortunate cyclic situation

690

where we'd swap well-ordered parents again.

690

where we'd swap well-ordered parents again.

691

692

See the doc for `debug_fix_issue6528` for the format documentation.

692

See the doc for `debug_fix_issue6528` for the format documentation.

693

"""

693

"""

694

ui.write(_(b"loading report file '%s'\n") % from_report)

694

ui.write(_(b"loading report file '%s'\n") % from_report)

695

696

with context(), open(from_report, mode='rb') as f:

696

with context(), open(from_report, mode='rb') as f:

697

for line in f.read().split(b'\n'):

697

for line in f.read().split(b'\n'):

698

if not line:

698

if not line:

699

continue

699

continue

700

filenodes, filename = line.split(b' ', 1)

700

filenodes, filename = line.split(b' ', 1)

701

fl = _filelog_from_filename(repo, filename)

701

fl = _filelog_from_filename(repo, filename)

702

to_fix = set(

702

to_fix = set(

703

fl.rev(binascii.unhexlify(n)) for n in filenodes.split(b',')

703

fl.rev(binascii.unhexlify(n)) for n in filenodes.split(b',')

704

)

704

)

705

excluded = set()

705

excluded = set()

706

707

for filerev in to_fix:

707

for filerev in to_fix:

708

if _is_revision_affected(fl, filerev):

708

if _is_revision_affected(fl, filerev):

709

msg = b"found affected revision %d for filelog '%s'\n"

709

msg = b"found affected revision %d for filelog '%s'\n"

710

ui.warn(msg % (filerev, filename))

710

ui.warn(msg % (filerev, filename))

711

else:

711

else:

712

msg = _(b"revision %s of file '%s' is not affected\n")

712

msg = _(b"revision %s of file '%s' is not affected\n")

713

msg %= (binascii.hexlify(fl.node(filerev)), filename)

713

msg %= (binascii.hexlify(fl.node(filerev)), filename)

714

ui.warn(msg)

714

ui.warn(msg)

715

excluded.add(filerev)

715

excluded.add(filerev)

716

717

to_fix = to_fix - excluded

717

to_fix = to_fix - excluded

718

if not to_fix:

718

if not to_fix:

719

msg = _(b"no affected revisions were found for '%s'\n")

719

msg = _(b"no affected revisions were found for '%s'\n")

720

ui.write(msg % filename)

720

ui.write(msg % filename)

721

continue

721

continue

722

if not dry_run:

722

if not dry_run:

723

_reorder_filelog_parents(repo, fl, sorted(to_fix))

723

_reorder_filelog_parents(repo, fl, sorted(to_fix))

724

725

726

def filter_delta_issue6528(revlog, deltas_iter):

726

def filter_delta_issue6528(revlog, deltas_iter):

727

"""filter incomind deltas to repaire issue 6528 on the fly"""

727

"""filter incomind deltas to repaire issue 6528 on the fly"""

728

metadata_cache = {}

728

metadata_cache = {}

729

730

deltacomputer = deltas.deltacomputer(revlog)

730

deltacomputer = deltas.deltacomputer(revlog)

731

732

for rev, d in enumerate(deltas_iter, len(revlog)):

732

for rev, d in enumerate(deltas_iter, len(revlog)):

733

(

733

(

734

node,

734

node,

735

p1_node,

735

p1_node,

736

p2_node,

736

p2_node,

737

linknode,

737

linknode,

738

deltabase,

738

deltabase,

739

delta,

739

delta,

740

flags,

740

flags,

741

sidedata,

741

sidedata,

742

) = d

742

) = d

743

744

if not revlog.index.has_node(deltabase):

744

if not revlog.index.has_node(deltabase):

745

raise error.LookupError(

745

raise error.LookupError(

746

deltabase, revlog.radix, _(b'unknown parent')

746

deltabase, revlog.radix, _(b'unknown parent')

747

)

747

)

748

base_rev = revlog.rev(deltabase)

748

base_rev = revlog.rev(deltabase)

749

if not revlog.index.has_node(p1_node):

749

if not revlog.index.has_node(p1_node):

750

raise error.LookupError(p1_node, revlog.radix, _(b'unknown parent'))

750

raise error.LookupError(p1_node, revlog.radix, _(b'unknown parent'))

751

p1_rev = revlog.rev(p1_node)

751

p1_rev = revlog.rev(p1_node)

752

if not revlog.index.has_node(p2_node):

752

if not revlog.index.has_node(p2_node):

753

raise error.LookupError(p2_node, revlog.radix, _(b'unknown parent'))

753

raise error.LookupError(p2_node, revlog.radix, _(b'unknown parent'))

754

p2_rev = revlog.rev(p2_node)

754

p2_rev = revlog.rev(p2_node)

755

756

is_censored = lambda: bool(flags & REVIDX_ISCENSORED)

756

is_censored = lambda: bool(flags & REVIDX_ISCENSORED)

757

delta_base = lambda: revlog.rev(delta_base)

757

delta_base = lambda: revlog.rev(delta_base)

758

delta_base = lambda: base_rev

758

delta_base = lambda: base_rev

759

parent_revs = lambda: (p1_rev, p2_rev)

759

parent_revs = lambda: (p1_rev, p2_rev)

760

761

def full_text():

761

def full_text():

762

# note: being able to reuse the full text computation in the

762

# note: being able to reuse the full text computation in the

763

# underlying addrevision would be useful however this is a bit too

763

# underlying addrevision would be useful however this is a bit too

764

# intrusive the for the "quick" issue6528 we are writing before the

764

# intrusive the for the "quick" issue6528 we are writing before the

765

# 5.8 release

765

# 5.8 release

766

textlen = mdiff.patchedsize(revlog.size(base_rev), delta)

766

textlen = mdiff.patchedsize(revlog.size(base_rev), delta)

767

768

revinfo = revlogutils.revisioninfo(

768

revinfo = revlogutils.revisioninfo(

769

node,

769

node,

770

p1_node,

770

p1_node,

771

p2_node,

771

p2_node,

772

[None],

772

[None],

773

textlen,

773

textlen,

774

(base_rev, delta),

774

(base_rev, delta),

775

flags,

775

flags,

776

)

776

)

777

# cached by the global "writing" context

777

# cached by the global "writing" context

778

assert revlog._writinghandles is not None

778

assert revlog._writinghandles is not None

779

if revlog._inline:

779

if revlog._inline:

780

fh = revlog._writinghandles[0]

780

fh = revlog._writinghandles[0]

781

else:

781

else:

782

fh = revlog._writinghandles[1]

782

fh = revlog._writinghandles[1]

783

return deltacomputer.buildtext(revinfo, fh)

783

return deltacomputer.buildtext(revinfo, fh)

784

785

is_affected = _is_revision_affected_fast_inner(

785

is_affected = _is_revision_affected_fast_inner(

786

is_censored,

786

is_censored,

787

delta_base,

787

delta_base,

788

lambda: delta,

788

lambda: delta,

789

full_text,

789

full_text,

790

parent_revs,

790

parent_revs,

791

rev,

791

rev,

792

metadata_cache,

792

metadata_cache,

793

)

793

)

794

if is_affected:

794

if is_affected:

795

d = (

795

d = (

796

node,

796

node,

797

p2_node,

797

p2_node,

798

p1_node,

798

p1_node,

799

linknode,

799

linknode,

800

deltabase,

800

deltabase,

801

delta,

801

delta,

802

flags,

802

flags,

803

sidedata,

803

sidedata,

804

)

804

)

805

yield d

805

yield d

806

807

808

def repair_issue6528(

808

def repair_issue6528(

809

ui, repo, dry_run=False, to_report=None, from_report=None, paranoid=False

809

ui, repo, dry_run=False, to_report=None, from_report=None, paranoid=False

810

):

810

):

811

@contextlib.contextmanager

811

@contextlib.contextmanager

812

def context():

812

def context():

813

if dry_run or to_report: # No need for locking

813

if dry_run or to_report: # No need for locking

814

yield

814

yield

815

else:

815

else:

816

with repo.wlock(), repo.lock():

816

with repo.wlock(), repo.lock():

817

yield

817

yield

818

819

if from_report:

819

if from_report:

820

return _from_report(ui, repo, context, from_report, dry_run)

820

return _from_report(ui, repo, context, from_report, dry_run)

821

822

report_entries = []

822

report_entries = []

823

824

with context():

824

with context():

825

files = list(

825

files = list(

826

entry

826

entry

827

for entry in repo.store.data_entries()

827

for entry in repo.store.data_entries()

828

if entry.is_revlog and entry.is_filelog

828

if entry.is_revlog and entry.is_filelog

829

)

829

)

830

831

progress = ui.makeprogress(

831

progress = ui.makeprogress(

832

_(b"looking for affected revisions"),

832

_(b"looking for affected revisions"),

833

unit=_(b"filelogs"),

833

unit=_(b"filelogs"),

834

total=len(files),

834

total=len(files),

835

)

835

)

836

found_nothing = True

836

found_nothing = True

837

838

for entry in files:

838

for entry in files:

839

progress.increment()

839

progress.increment()

840

filename = entry.target_id

840

filename = entry.target_id

841

fl = _filelog_from_filename(repo, entry.target_id)

841

fl = _filelog_from_filename(repo, entry.target_id)

842

843

# Set of filerevs (or hex filenodes if `to_report`) that need fixing

843

# Set of filerevs (or hex filenodes if `to_report`) that need fixing

844

to_fix = set()

844

to_fix = set()

845

metadata_cache = {}

845

metadata_cache = {}

846

for filerev in fl.revs():

846

for filerev in fl.revs():

847

affected = _is_revision_affected_fast(

847

affected = _is_revision_affected_fast(

848

repo, fl, filerev, metadata_cache

848

repo, fl, filerev, metadata_cache

849

)

849

)

850

if paranoid:

850

if paranoid:

851

slow = _is_revision_affected(fl, filerev)

851

slow = _is_revision_affected(fl, filerev)

852

if slow != affected:

852

if slow != affected:

853

msg = _(b"paranoid check failed for '%s' at node %s")

853

msg = _(b"paranoid check failed for '%s' at node %s")

854

node = binascii.hexlify(fl.node(filerev))

854

node = binascii.hexlify(fl.node(filerev))

855

raise error.Abort(msg % (filename, node))

855

raise error.Abort(msg % (filename, node))

856

if affected:

856

if affected:

857

msg = b"found affected revision %d for file '%s'\n"

857

msg = b"found affected revision %d for file '%s'\n"

858

ui.warn(msg % (filerev, filename))

858

ui.warn(msg % (filerev, filename))

859

found_nothing = False

859

found_nothing = False

860

if not dry_run:

860

if not dry_run:

861

if to_report:

861

if to_report:

862

to_fix.add(binascii.hexlify(fl.node(filerev)))

862

to_fix.add(binascii.hexlify(fl.node(filerev)))

863

else:

863

else:

864

to_fix.add(filerev)

864

to_fix.add(filerev)

865

866

if to_fix:

866

if to_fix:

867

to_fix = sorted(to_fix)

867

to_fix = sorted(to_fix)

868

if to_report:

868

if to_report:

869

report_entries.append((filename, to_fix))

869

report_entries.append((filename, to_fix))

870

else:

870

else:

871

_reorder_filelog_parents(repo, fl, to_fix)

871

_reorder_filelog_parents(repo, fl, to_fix)

872

873

if found_nothing:

873

if found_nothing:

874

ui.write(_(b"no affected revisions were found\n"))

874

ui.write(_(b"no affected revisions were found\n"))

875

876

if to_report and report_entries:

876

if to_report and report_entries:

877

with open(to_report, mode="wb") as f:

877

with open(to_report, mode="wb") as f:

878

for path, to_fix in report_entries:

878

for path, to_fix in report_entries:

879

f.write(b"%s %s\n" % (b",".join(to_fix), path))

879

f.write(b"%s %s\n" % (b",".join(to_fix), path))

880

881

progress.complete()

881

progress.complete()

	Site-wide shortcuts
/	Use quick search box
g h	Goto home page
g g	Goto my private gists page
g G	Goto my public gists page
g 0-9	Goto bookmarked items from 0-9
n r	New repository page
n g	New gist page

	Repositories
g s	Goto summary page
g c	Goto changelog page
g f	Goto files page
g F	Goto files page with file search activated
g p	Goto pull requests page
g o	Goto repository settings
g O	Goto repository access permissions settings
t s	Toggle sidebar on some pages

             # censor code related to censoring revision
             # coding: utf8
             #
             # Copyright 2021 Pierre-Yves David <pierre-yves.david@octobus.net>
             # Copyright 2015 Google, Inc <martinvonz@google.com>
             #
             # This software may be used and distributed according to the terms of the
             # GNU General Public License version 2 or any later version.
             import binascii
             import contextlib
             import os
             import struct
             from ..node import (
                 nullrev,
             )
             from .constants import (
                 COMP_MODE_PLAIN,
                 ENTRY_DATA_COMPRESSED_LENGTH,
                 ENTRY_DATA_COMPRESSION_MODE,
                 ENTRY_DATA_OFFSET,
                 ENTRY_DATA_UNCOMPRESSED_LENGTH,
                 ENTRY_DELTA_BASE,
                 ENTRY_LINK_REV,
                 ENTRY_NODE_ID,
                 ENTRY_PARENT_1,
                 ENTRY_PARENT_2,
                 ENTRY_SIDEDATA_COMPRESSED_LENGTH,
                 ENTRY_SIDEDATA_COMPRESSION_MODE,
                 ENTRY_SIDEDATA_OFFSET,
                 REVIDX_ISCENSORED,
                 REVLOGV0,
                 REVLOGV1,
             )
             from ..i18n import _
             from .. import (
                 error,
                 mdiff,
                 pycompat,
                 revlogutils,
                 util,
             )
             from ..utils import (
                 storageutil,
             )
             from . import (
                 constants,
                 deltas,
             )
             def v1_censor(rl, tr, censornode, tombstone=b''):
                 """censors a revision in a "version 1" revlog"""
                 assert rl._format_version == constants.REVLOGV1, rl._format_version
                 # avoid cycle
                 from .. import revlog
                 censorrev = rl.rev(censornode)
                 tombstone = storageutil.packmeta({b'censored': tombstone}, b'')
                 # Rewriting the revlog in place is hard. Our strategy for censoring is
                 # to create a new revlog, copy all revisions to it, then replace the
                 # revlogs on transaction close.
                 #
                 # This is a bit dangerous. We could easily have a mismatch of state.
                 newrl = revlog.revlog(
                     rl.opener,
                     target=rl.target,
                     radix=rl.radix,
                     postfix=b'tmpcensored',
                     censorable=True,
                 )
                 newrl._format_version = rl._format_version
                 newrl._format_flags = rl._format_flags
                 newrl._generaldelta = rl._generaldelta
                 newrl._parse_index = rl._parse_index
                 for rev in rl.revs():
                     node = rl.node(rev)
                     p1, p2 = rl.parents(node)
                     if rev == censorrev:
                         newrl.addrawrevision(
                             tombstone,
                             tr,
                             rl.linkrev(censorrev),
                             p1,
                             p2,
                             censornode,
                             constants.REVIDX_ISCENSORED,
                         )
                         if newrl.deltaparent(rev) != nullrev:
                             m = _(b'censored revision stored as delta; cannot censor')
                             h = _(
                                 b'censoring of revlogs is not fully implemented;'
                                 b' please report this bug'
                             )
                             raise error.Abort(m, hint=h)
                         continue
                     if rl.iscensored(rev):
                         if rl.deltaparent(rev) != nullrev:
                             m = _(
                                 b'cannot censor due to censored '
                                 b'revision having delta stored'
                             )
                             raise error.Abort(m)
                         rawtext = rl._chunk(rev)
                     else:
                         rawtext = rl.rawdata(rev)
                     newrl.addrawrevision(
                         rawtext, tr, rl.linkrev(rev), p1, p2, node, rl.flags(rev)
                     )
                 tr.addbackup(rl._indexfile, location=b'store')
                 if not rl._inline:
                     tr.addbackup(rl._datafile, location=b'store')
                 rl.opener.rename(newrl._indexfile, rl._indexfile)
                 if not rl._inline:
                     rl.opener.rename(newrl._datafile, rl._datafile)
                 rl.clearcaches()
                 rl._loadindex()
             def v2_censor(revlog, tr, censornode, tombstone=b''):
                 """censors a revision in a "version 2" revlog"""
                 assert revlog._format_version != REVLOGV0, revlog._format_version
                 assert revlog._format_version != REVLOGV1, revlog._format_version
                 censor_revs = {revlog.rev(censornode)}
                 _rewrite_v2(revlog, tr, censor_revs, tombstone)
             def _rewrite_v2(revlog, tr, censor_revs, tombstone=b''):
                 """rewrite a revlog to censor some of its content
                 General principle
                 We create new revlog files (index/data/sidedata) to copy the content of
                 the existing data without the censored data.
                 We need to recompute new delta for any revision that used the censored
                 revision as delta base. As the cumulative size of the new delta may be
                 large, we store them in a temporary file until they are stored in their
                 final destination.
                 All data before the censored data can be blindly copied. The rest needs
                 to be copied as we go and the associated index entry needs adjustement.
                 """
                 assert revlog._format_version != REVLOGV0, revlog._format_version
                 assert revlog._format_version != REVLOGV1, revlog._format_version
                 old_index = revlog.index
                 docket = revlog._docket
                 tombstone = storageutil.packmeta({b'censored': tombstone}, b'')
                 first_excl_rev = min(censor_revs)
                 first_excl_entry = revlog.index[first_excl_rev]
                 index_cutoff = revlog.index.entry_size * first_excl_rev
                 data_cutoff = first_excl_entry[ENTRY_DATA_OFFSET] >> 16
                 sidedata_cutoff = revlog.sidedata_cut_off(first_excl_rev)
                 with pycompat.unnamedtempfile(mode=b"w+b") as tmp_storage:
                     # rev → (new_base, data_start, data_end, compression_mode)
                     rewritten_entries = _precompute_rewritten_delta(
                         revlog,
                         old_index,
                         censor_revs,
                         tmp_storage,
                     )
                     all_files = _setup_new_files(
                         revlog,
                         index_cutoff,
                         data_cutoff,
                         sidedata_cutoff,
                     )
                     # we dont need to open the old index file since its content already
                     # exist in a usable form in `old_index`.
                     with all_files() as open_files:
                         (
                             old_data_file,
                             old_sidedata_file,
                             new_index_file,
                             new_data_file,
                             new_sidedata_file,
                         ) = open_files
                         # writing the censored revision
                         # Writing all subsequent revisions
                         for rev in range(first_excl_rev, len(old_index)):
                             if rev in censor_revs:
                                 _rewrite_censor(
                                     revlog,
                                     old_index,
                                     open_files,
                                     rev,
                                     tombstone,
                                 )
                             else:
                                 _rewrite_simple(
                                     revlog,
                                     old_index,
                                     open_files,
                                     rev,
                                     rewritten_entries,
                                     tmp_storage,
                                 )
                 docket.write(transaction=None, stripping=True)
             def _precompute_rewritten_delta(
                 revlog,
                 old_index,
                 excluded_revs,
                 tmp_storage,
             ):
                 """Compute new delta for revisions whose delta is based on revision that
                 will not survive as is.
                 Return a mapping: {rev → (new_base, data_start, data_end, compression_mode)}
                 """
                 dc = deltas.deltacomputer(revlog)
                 rewritten_entries = {}
                 first_excl_rev = min(excluded_revs)
-                with revlog._segmentfile._open_read() as dfh:
+                with revlog.reading(), revlog._segmentfile._open_read() as dfh:
                     for rev in range(first_excl_rev, len(old_index)):
                         if rev in excluded_revs:
                             # this revision will be preserved as is, so we don't need to
                             # consider recomputing a delta.
                             continue
                         entry = old_index[rev]
                         if entry[ENTRY_DELTA_BASE] not in excluded_revs:
                             continue
                         # This is a revision that use the censored revision as the base
                         # for its delta. We need a need new deltas
                         if entry[ENTRY_DATA_UNCOMPRESSED_LENGTH] == 0:
                             # this revision is empty, we can delta against nullrev
                             rewritten_entries[rev] = (nullrev, 0, 0, COMP_MODE_PLAIN)
                         else:
-                            text = revlog.rawdata(rev, _df=dfh)
+                            text = revlog.rawdata(rev)
                             info = revlogutils.revisioninfo(
                                 node=entry[ENTRY_NODE_ID],
                                 p1=revlog.node(entry[ENTRY_PARENT_1]),
                                 p2=revlog.node(entry[ENTRY_PARENT_2]),
                                 btext=[text],
                                 textlen=len(text),
                                 cachedelta=None,
                                 flags=entry[ENTRY_DATA_OFFSET] & 0xFFFF,
                             )
                             d = dc.finddeltainfo(
                                 info, dfh, excluded_bases=excluded_revs, target_rev=rev
                             )
                             default_comp = revlog._docket.default_compression_header
                             comp_mode, d = deltas.delta_compression(default_comp, d)
                             # using `tell` is a bit lazy, but we are not here for speed
                             start = tmp_storage.tell()
                             tmp_storage.write(d.data[1])
                             end = tmp_storage.tell()
                             rewritten_entries[rev] = (d.base, start, end, comp_mode)
                 return rewritten_entries
             def _setup_new_files(
                 revlog,
                 index_cutoff,
                 data_cutoff,
                 sidedata_cutoff,
             ):
                 """
                 return a context manager to open all the relevant files:
                 - old_data_file,
                 - old_sidedata_file,
                 - new_index_file,
                 - new_data_file,
                 - new_sidedata_file,
                 The old_index_file is not here because it is accessed through the
                 `old_index` object if the caller function.
                 """
                 docket = revlog._docket
                 old_index_filepath = revlog.opener.join(docket.index_filepath())
                 old_data_filepath = revlog.opener.join(docket.data_filepath())
                 old_sidedata_filepath = revlog.opener.join(docket.sidedata_filepath())
                 new_index_filepath = revlog.opener.join(docket.new_index_file())
                 new_data_filepath = revlog.opener.join(docket.new_data_file())
                 new_sidedata_filepath = revlog.opener.join(docket.new_sidedata_file())
                 util.copyfile(old_index_filepath, new_index_filepath, nb_bytes=index_cutoff)
                 util.copyfile(old_data_filepath, new_data_filepath, nb_bytes=data_cutoff)
                 util.copyfile(
                     old_sidedata_filepath,
                     new_sidedata_filepath,
                     nb_bytes=sidedata_cutoff,
                 )
                 revlog.opener.register_file(docket.index_filepath())
                 revlog.opener.register_file(docket.data_filepath())
                 revlog.opener.register_file(docket.sidedata_filepath())
                 docket.index_end = index_cutoff
                 docket.data_end = data_cutoff
                 docket.sidedata_end = sidedata_cutoff
                 # reload the revlog internal information
                 revlog.clearcaches()
                 revlog._loadindex(docket=docket)
                 @contextlib.contextmanager
                 def all_files_opener():
                     # hide opening in an helper function to please check-code, black
                     # and various python version at the same time
                     with open(old_data_filepath, 'rb') as old_data_file:
                         with open(old_sidedata_filepath, 'rb') as old_sidedata_file:
                             with open(new_index_filepath, 'r+b') as new_index_file:
                                 with open(new_data_filepath, 'r+b') as new_data_file:
                                     with open(
                                         new_sidedata_filepath, 'r+b'
                                     ) as new_sidedata_file:
                                         new_index_file.seek(0, os.SEEK_END)
                                         assert new_index_file.tell() == index_cutoff
                                         new_data_file.seek(0, os.SEEK_END)
                                         assert new_data_file.tell() == data_cutoff
                                         new_sidedata_file.seek(0, os.SEEK_END)
                                         assert new_sidedata_file.tell() == sidedata_cutoff
                                         yield (
                                             old_data_file,
                                             old_sidedata_file,
                                             new_index_file,
                                             new_data_file,
                                             new_sidedata_file,
                                         )
                 return all_files_opener
             def _rewrite_simple(
                 revlog,
                 old_index,
                 all_files,
                 rev,
                 rewritten_entries,
                 tmp_storage,
             ):
                 """append a normal revision to the index after the rewritten one(s)"""
                 (
                     old_data_file,
                     old_sidedata_file,
                     new_index_file,
                     new_data_file,
                     new_sidedata_file,
                 ) = all_files
                 entry = old_index[rev]
                 flags = entry[ENTRY_DATA_OFFSET] & 0xFFFF
                 old_data_offset = entry[ENTRY_DATA_OFFSET] >> 16
                 if rev not in rewritten_entries:
                     old_data_file.seek(old_data_offset)
                     new_data_size = entry[ENTRY_DATA_COMPRESSED_LENGTH]
                     new_data = old_data_file.read(new_data_size)
                     data_delta_base = entry[ENTRY_DELTA_BASE]
                     d_comp_mode = entry[ENTRY_DATA_COMPRESSION_MODE]
                 else:
                     (
                         data_delta_base,
                         start,
                         end,
                         d_comp_mode,
                     ) = rewritten_entries[rev]
                     new_data_size = end - start
                     tmp_storage.seek(start)
                     new_data = tmp_storage.read(new_data_size)
                 # It might be faster to group continuous read/write operation,
                 # however, this is censor, an operation that is not focussed
                 # around stellar performance. So I have not written this
                 # optimisation yet.
                 new_data_offset = new_data_file.tell()
                 new_data_file.write(new_data)
                 sidedata_size = entry[ENTRY_SIDEDATA_COMPRESSED_LENGTH]
                 new_sidedata_offset = new_sidedata_file.tell()
                 if 0 < sidedata_size:
                     old_sidedata_offset = entry[ENTRY_SIDEDATA_OFFSET]
                     old_sidedata_file.seek(old_sidedata_offset)
                     new_sidedata = old_sidedata_file.read(sidedata_size)
                     new_sidedata_file.write(new_sidedata)
                 data_uncompressed_length = entry[ENTRY_DATA_UNCOMPRESSED_LENGTH]
                 sd_com_mode = entry[ENTRY_SIDEDATA_COMPRESSION_MODE]
                 assert data_delta_base <= rev, (data_delta_base, rev)
                 new_entry = revlogutils.entry(
                     flags=flags,
                     data_offset=new_data_offset,
                     data_compressed_length=new_data_size,
                     data_uncompressed_length=data_uncompressed_length,
                     data_delta_base=data_delta_base,
                     link_rev=entry[ENTRY_LINK_REV],
                     parent_rev_1=entry[ENTRY_PARENT_1],
                     parent_rev_2=entry[ENTRY_PARENT_2],
                     node_id=entry[ENTRY_NODE_ID],
                     sidedata_offset=new_sidedata_offset,
                     sidedata_compressed_length=sidedata_size,
                     data_compression_mode=d_comp_mode,
                     sidedata_compression_mode=sd_com_mode,
                 )
                 revlog.index.append(new_entry)
                 entry_bin = revlog.index.entry_binary(rev)
                 new_index_file.write(entry_bin)
                 revlog._docket.index_end = new_index_file.tell()
                 revlog._docket.data_end = new_data_file.tell()
                 revlog._docket.sidedata_end = new_sidedata_file.tell()
             def _rewrite_censor(
                 revlog,
                 old_index,
                 all_files,
                 rev,
                 tombstone,
             ):
                 """rewrite and append a censored revision"""
                 (
                     old_data_file,
                     old_sidedata_file,
                     new_index_file,
                     new_data_file,
                     new_sidedata_file,
                 ) = all_files
                 entry = old_index[rev]
                 # XXX consider trying the default compression too
                 new_data_size = len(tombstone)
                 new_data_offset = new_data_file.tell()
                 new_data_file.write(tombstone)
                 # we are not adding any sidedata as they might leak info about the censored version
                 link_rev = entry[ENTRY_LINK_REV]
                 p1 = entry[ENTRY_PARENT_1]
                 p2 = entry[ENTRY_PARENT_2]
                 new_entry = revlogutils.entry(
                     flags=constants.REVIDX_ISCENSORED,
                     data_offset=new_data_offset,
                     data_compressed_length=new_data_size,
                     data_uncompressed_length=new_data_size,
                     data_delta_base=rev,
                     link_rev=link_rev,
                     parent_rev_1=p1,
                     parent_rev_2=p2,
                     node_id=entry[ENTRY_NODE_ID],
                     sidedata_offset=0,
                     sidedata_compressed_length=0,
                     data_compression_mode=COMP_MODE_PLAIN,
                     sidedata_compression_mode=COMP_MODE_PLAIN,
                 )
                 revlog.index.append(new_entry)
                 entry_bin = revlog.index.entry_binary(rev)
                 new_index_file.write(entry_bin)
                 revlog._docket.index_end = new_index_file.tell()
                 revlog._docket.data_end = new_data_file.tell()
             def _get_filename_from_filelog_index(path):
                 # Drop the extension and the `data/` prefix
                 path_part = path.rsplit(b'.', 1)[0].split(b'/', 1)
                 if len(path_part) < 2:
                     msg = _(b"cannot recognize filelog from filename: '%s'")
                     msg %= path
                     raise error.Abort(msg)
                 return path_part[1]
             def _filelog_from_filename(repo, path):
                 """Returns the filelog for the given `path`. Stolen from `engine.py`"""
                 from .. import filelog  # avoid cycle
                 fl = filelog.filelog(repo.svfs, path)
                 return fl
             def _write_swapped_parents(repo, rl, rev, offset, fp):
                 """Swaps p1 and p2 and overwrites the revlog entry for `rev` in `fp`"""
                 from ..pure import parsers  # avoid cycle
                 if repo._currentlock(repo._lockref) is None:
                     # Let's be paranoid about it
                     msg = "repo needs to be locked to rewrite parents"
                     raise error.ProgrammingError(msg)
                 index_format = parsers.IndexObject.index_format
                 entry = rl.index[rev]
                 new_entry = list(entry)
                 new_entry[5], new_entry[6] = entry[6], entry[5]
                 packed = index_format.pack(*new_entry[:8])
                 fp.seek(offset)
                 fp.write(packed)
             def _reorder_filelog_parents(repo, fl, to_fix):
                 """
                 Swaps p1 and p2 for all `to_fix` revisions of filelog `fl` and writes the
                 new version to disk, overwriting the old one with a rename.
                 """
                 from ..pure import parsers  # avoid cycle
                 ui = repo.ui
                 assert len(to_fix) > 0
                 rl = fl._revlog
                 if rl._format_version != constants.REVLOGV1:
                     msg = "expected version 1 revlog, got version '%d'" % rl._format_version
                     raise error.ProgrammingError(msg)
                 index_file = rl._indexfile
                 new_file_path = index_file + b'.tmp-parents-fix'
                 repaired_msg = _(b"repaired revision %d of 'filelog %s'\n")
                 with ui.uninterruptible():
                     try:
                         util.copyfile(
                             rl.opener.join(index_file),
                             rl.opener.join(new_file_path),
                             checkambig=rl._checkambig,
                         )
                         with rl.opener(new_file_path, mode=b"r+") as fp:
                             if rl._inline:
                                 index = parsers.InlinedIndexObject(fp.read())
                                 for rev in fl.revs():
                                     if rev in to_fix:
                                         offset = index._calculate_index(rev)
                                         _write_swapped_parents(repo, rl, rev, offset, fp)
                                         ui.write(repaired_msg % (rev, index_file))
                             else:
                                 index_format = parsers.IndexObject.index_format
                                 for rev in to_fix:
                                     offset = rev * index_format.size
                                     _write_swapped_parents(repo, rl, rev, offset, fp)
                                     ui.write(repaired_msg % (rev, index_file))
                         rl.opener.rename(new_file_path, index_file)
                         rl.clearcaches()
                         rl._loadindex()
                     finally:
                         util.tryunlink(new_file_path)
             def _is_revision_affected(fl, filerev, metadata_cache=None):
                 full_text = lambda: fl._revlog.rawdata(filerev)
                 parent_revs = lambda: fl._revlog.parentrevs(filerev)
                 return _is_revision_affected_inner(
                     full_text, parent_revs, filerev, metadata_cache
                 )
             def _is_revision_affected_inner(
                 full_text,
                 parents_revs,
                 filerev,
                 metadata_cache=None,
             ):
                 """Mercurial currently (5.9rc0) uses `p1 == nullrev and p2 != nullrev` as a
                 special meaning compared to the reverse in the context of filelog-based
                 copytracing. issue6528 exists because new code assumed that parent ordering
                 didn't matter, so this detects if the revision contains metadata (since
                 it's only used for filelog-based copytracing) and its parents are in the
                 "wrong" order."""
                 try:
                     raw_text = full_text()
                 except error.CensoredNodeError:
                     # We don't care about censored nodes as they never carry metadata
                     return False
                 # raw text can be a `memoryview`, which doesn't implement `startswith`
                 has_meta = bytes(raw_text[:2]) == b'\x01\n'
                 if metadata_cache is not None:
                     metadata_cache[filerev] = has_meta
                 if has_meta:
                     (p1, p2) = parents_revs()
                     if p1 != nullrev and p2 == nullrev:
                         return True
                 return False
             def _is_revision_affected_fast(repo, fl, filerev, metadata_cache):
                 rl = fl._revlog
                 is_censored = lambda: rl.iscensored(filerev)
                 delta_base = lambda: rl.deltaparent(filerev)
                 delta = lambda: rl._chunk(filerev)
                 full_text = lambda: rl.rawdata(filerev)
                 parent_revs = lambda: rl.parentrevs(filerev)
                 return _is_revision_affected_fast_inner(
                     is_censored,
                     delta_base,
                     delta,
                     full_text,
                     parent_revs,
                     filerev,
                     metadata_cache,
                 )
             def _is_revision_affected_fast_inner(
                 is_censored,
                 delta_base,
                 delta,
                 full_text,
                 parent_revs,
                 filerev,
                 metadata_cache,
             ):
                 """Optimization fast-path for `_is_revision_affected`.
                 `metadata_cache` is a dict of `{rev: has_metadata}` which allows any
                 revision to check if its base has metadata, saving computation of the full
                 text, instead looking at the current delta.
                 This optimization only works if the revisions are looked at in order."""
                 if is_censored():
                     # Censored revisions don't contain metadata, so they cannot be affected
                     metadata_cache[filerev] = False
                     return False
                 p1, p2 = parent_revs()
                 if p1 == nullrev or p2 != nullrev:
                     return False
                 delta_parent = delta_base()
                 parent_has_metadata = metadata_cache.get(delta_parent)
                 if parent_has_metadata is None:
                     return _is_revision_affected_inner(
                         full_text,
                         parent_revs,
                         filerev,
                         metadata_cache,
                     )
                 chunk = delta()
                 if not len(chunk):
                     # No diff for this revision
                     return parent_has_metadata
                 header_length = 12
                 if len(chunk) < header_length:
                     raise error.Abort(_(b"patch cannot be decoded"))
                 start, _end, _length = struct.unpack(b">lll", chunk[:header_length])
                 if start < 2:  # len(b'\x01\n') == 2
                     # This delta does *something* to the metadata marker (if any).
                     # Check it the slow way
                     is_affected = _is_revision_affected_inner(
                         full_text,
                         parent_revs,
                         filerev,
                         metadata_cache,
                     )
                     return is_affected
                 # The diff did not remove or add the metadata header, it's then in the same
                 # situation as its parent
                 metadata_cache[filerev] = parent_has_metadata
                 return parent_has_metadata
             def _from_report(ui, repo, context, from_report, dry_run):
                 """
                 Fix the revisions given in the `from_report` file, but still checks if the
                 revisions are indeed affected to prevent an unfortunate cyclic situation
                 where we'd swap well-ordered parents again.
                 See the doc for `debug_fix_issue6528` for the format documentation.
                 """
                 ui.write(_(b"loading report file '%s'\n") % from_report)
                 with context(), open(from_report, mode='rb') as f:
                     for line in f.read().split(b'\n'):
                         if not line:
                             continue
                         filenodes, filename = line.split(b' ', 1)
                         fl = _filelog_from_filename(repo, filename)
                         to_fix = set(
                             fl.rev(binascii.unhexlify(n)) for n in filenodes.split(b',')
                         )
                         excluded = set()
                         for filerev in to_fix:
                             if _is_revision_affected(fl, filerev):
                                 msg = b"found affected revision %d for filelog '%s'\n"
                                 ui.warn(msg % (filerev, filename))
                             else:
                                 msg = _(b"revision %s of file '%s' is not affected\n")
                                 msg %= (binascii.hexlify(fl.node(filerev)), filename)
                                 ui.warn(msg)
                                 excluded.add(filerev)
                         to_fix = to_fix - excluded
                         if not to_fix:
                             msg = _(b"no affected revisions were found for '%s'\n")
                             ui.write(msg % filename)
                             continue
                         if not dry_run:
                             _reorder_filelog_parents(repo, fl, sorted(to_fix))
             def filter_delta_issue6528(revlog, deltas_iter):
                 """filter incomind deltas to repaire issue 6528 on the fly"""
                 metadata_cache = {}
                 deltacomputer = deltas.deltacomputer(revlog)
                 for rev, d in enumerate(deltas_iter, len(revlog)):
                     (
                         node,
                         p1_node,
                         p2_node,
                         linknode,
                         deltabase,
                         delta,
                         flags,
                         sidedata,
                     ) = d
                     if not revlog.index.has_node(deltabase):
                         raise error.LookupError(
                             deltabase, revlog.radix, _(b'unknown parent')
                         )
                     base_rev = revlog.rev(deltabase)
                     if not revlog.index.has_node(p1_node):
                         raise error.LookupError(p1_node, revlog.radix, _(b'unknown parent'))
                     p1_rev = revlog.rev(p1_node)
                     if not revlog.index.has_node(p2_node):
                         raise error.LookupError(p2_node, revlog.radix, _(b'unknown parent'))
                     p2_rev = revlog.rev(p2_node)
                     is_censored = lambda: bool(flags & REVIDX_ISCENSORED)
                     delta_base = lambda: revlog.rev(delta_base)
                     delta_base = lambda: base_rev
                     parent_revs = lambda: (p1_rev, p2_rev)
                     def full_text():
                         # note: being able to reuse the full text computation in the
                         # underlying addrevision would be useful however this is a bit too
                         # intrusive the for the "quick" issue6528 we are writing before the
                         # 5.8 release
                         textlen = mdiff.patchedsize(revlog.size(base_rev), delta)
                         revinfo = revlogutils.revisioninfo(
                             node,
                             p1_node,
                             p2_node,
                             [None],
                             textlen,
                             (base_rev, delta),
                             flags,
                         )
                         # cached by the global "writing" context
                         assert revlog._writinghandles is not None
                         if revlog._inline:
                             fh = revlog._writinghandles[0]
                         else:
                             fh = revlog._writinghandles[1]
                         return deltacomputer.buildtext(revinfo, fh)
                     is_affected = _is_revision_affected_fast_inner(
                         is_censored,
                         delta_base,
                         lambda: delta,
                         full_text,
                         parent_revs,
                         rev,
                         metadata_cache,
                     )
                     if is_affected:
                         d = (
                             node,
                             p2_node,
                             p1_node,
                             linknode,
                             deltabase,
                             delta,
                             flags,
                             sidedata,
                         )
                     yield d
             def repair_issue6528(
                 ui, repo, dry_run=False, to_report=None, from_report=None, paranoid=False
             ):
                 @contextlib.contextmanager
                 def context():
                     if dry_run or to_report:  # No need for locking
                         yield
                     else:
                         with repo.wlock(), repo.lock():
                             yield
                 if from_report:
                     return _from_report(ui, repo, context, from_report, dry_run)
                 report_entries = []
                 with context():
                     files = list(
                         entry
                         for entry in repo.store.data_entries()
                         if entry.is_revlog and entry.is_filelog
                     )
                     progress = ui.makeprogress(
                         _(b"looking for affected revisions"),
                         unit=_(b"filelogs"),
                         total=len(files),
                     )
                     found_nothing = True
                     for entry in files:
                         progress.increment()
                         filename = entry.target_id
                         fl = _filelog_from_filename(repo, entry.target_id)
                         # Set of filerevs (or hex filenodes if `to_report`) that need fixing
                         to_fix = set()
                         metadata_cache = {}
                         for filerev in fl.revs():
                             affected = _is_revision_affected_fast(
                                 repo, fl, filerev, metadata_cache
                             )
                             if paranoid:
                                 slow = _is_revision_affected(fl, filerev)
                                 if slow != affected:
                                     msg = _(b"paranoid check failed for '%s' at node %s")
                                     node = binascii.hexlify(fl.node(filerev))
                                     raise error.Abort(msg % (filename, node))
                             if affected:
                                 msg = b"found affected revision %d for file '%s'\n"
                                 ui.warn(msg % (filerev, filename))
                                 found_nothing = False
                                 if not dry_run:
                                     if to_report:
                                         to_fix.add(binascii.hexlify(fl.node(filerev)))
                                     else:
                                         to_fix.add(filerev)
                         if to_fix:
                             to_fix = sorted(to_fix)
                             if to_report:
                                 report_entries.append((filename, to_fix))
                             else:
                                 _reorder_filelog_parents(repo, fl, to_fix)
                     if found_nothing:
                         ui.write(_(b"no affected revisions were found\n"))
                     if to_report and report_entries:
                         with open(to_report, mode="wb") as f:
                             for path, to_fix in report_entries:
                                 f.write(b"%s %s\n" % (b",".join(to_fix), path))
                     progress.complete()