upstream/mercurial-mirror Commit - r48627:c02ce6de

1

# censor code related to censoring revision

1

# censor code related to censoring revision

2

# coding: utf8

2

# coding: utf8

3

#

3

#

4

5

6

#

6

#

7

# This software may be used and distributed according to the terms of the

7

# This software may be used and distributed according to the terms of the

8

# GNU General Public License version 2 or any later version.

8

# GNU General Public License version 2 or any later version.

9

10

import binascii

10

import binascii

11

import contextlib

11

import contextlib

12

import os

12

import os

13

import struct

13

import struct

14

15

from ..node import (

15

from ..node import (

16

nullrev,

16

nullrev,

17

)

17

)

18

from .constants import (

18

from .constants import (

19

COMP_MODE_PLAIN,

19

COMP_MODE_PLAIN,

20

ENTRY_DATA_COMPRESSED_LENGTH,

20

ENTRY_DATA_COMPRESSED_LENGTH,

21

ENTRY_DATA_COMPRESSION_MODE,

21

ENTRY_DATA_COMPRESSION_MODE,

22

ENTRY_DATA_OFFSET,

22

ENTRY_DATA_OFFSET,

23

ENTRY_DATA_UNCOMPRESSED_LENGTH,

23

ENTRY_DATA_UNCOMPRESSED_LENGTH,

24

ENTRY_DELTA_BASE,

24

ENTRY_DELTA_BASE,

25

ENTRY_LINK_REV,

25

ENTRY_LINK_REV,

26

ENTRY_NODE_ID,

26

ENTRY_NODE_ID,

27

ENTRY_PARENT_1,

27

ENTRY_PARENT_1,

28

ENTRY_PARENT_2,

28

ENTRY_PARENT_2,

29

ENTRY_SIDEDATA_COMPRESSED_LENGTH,

29

ENTRY_SIDEDATA_COMPRESSED_LENGTH,

30

ENTRY_SIDEDATA_COMPRESSION_MODE,

30

ENTRY_SIDEDATA_COMPRESSION_MODE,

31

ENTRY_SIDEDATA_OFFSET,

31

ENTRY_SIDEDATA_OFFSET,

32

REVLOGV0,

32

REVLOGV0,

33

REVLOGV1,

33

REVLOGV1,

34

)

34

)

35

from ..i18n import _

35

from ..i18n import _

36

37

from .. import (

37

from .. import (

38

error,

38

error,

39

pycompat,

39

pycompat,

40

revlogutils,

40

revlogutils,

41

util,

41

util,

42

)

42

)

43

from ..utils import (

43

from ..utils import (

44

storageutil,

44

storageutil,

45

)

45

)

46

from . import (

46

from . import (

47

constants,

47

constants,

48

deltas,

48

deltas,

49

)

49

)

50

51

52

def v1_censor(rl, tr, censornode, tombstone=b''):

52

def v1_censor(rl, tr, censornode, tombstone=b''):

53

"""censors a revision in a "version 1" revlog"""

53

"""censors a revision in a "version 1" revlog"""

54

assert rl._format_version == constants.REVLOGV1, rl._format_version

54

assert rl._format_version == constants.REVLOGV1, rl._format_version

55

56

# avoid cycle

56

# avoid cycle

57

from .. import revlog

57

from .. import revlog

58

59

censorrev = rl.rev(censornode)

59

censorrev = rl.rev(censornode)

60

tombstone = storageutil.packmeta({b'censored': tombstone}, b'')

60

tombstone = storageutil.packmeta({b'censored': tombstone}, b'')

61

62

# Rewriting the revlog in place is hard. Our strategy for censoring is

62

# Rewriting the revlog in place is hard. Our strategy for censoring is

63

# to create a new revlog, copy all revisions to it, then replace the

63

# to create a new revlog, copy all revisions to it, then replace the

64

# revlogs on transaction close.

64

# revlogs on transaction close.

65

#

65

#

66

# This is a bit dangerous. We could easily have a mismatch of state.

66

# This is a bit dangerous. We could easily have a mismatch of state.

67

newrl = revlog.revlog(

67

newrl = revlog.revlog(

68

rl.opener,

68

rl.opener,

69

target=rl.target,

69

target=rl.target,

70

radix=rl.radix,

70

radix=rl.radix,

71

postfix=b'tmpcensored',

71

postfix=b'tmpcensored',

72

censorable=True,

72

censorable=True,

73

)

73

)

74

newrl._format_version = rl._format_version

74

newrl._format_version = rl._format_version

75

newrl._format_flags = rl._format_flags

75

newrl._format_flags = rl._format_flags

76

newrl._generaldelta = rl._generaldelta

76

newrl._generaldelta = rl._generaldelta

77

newrl._parse_index = rl._parse_index

77

newrl._parse_index = rl._parse_index

78

79

for rev in rl.revs():

79

for rev in rl.revs():

80

node = rl.node(rev)

80

node = rl.node(rev)

81

p1, p2 = rl.parents(node)

81

p1, p2 = rl.parents(node)

82

83

if rev == censorrev:

83

if rev == censorrev:

84

newrl.addrawrevision(

84

newrl.addrawrevision(

85

tombstone,

85

tombstone,

86

tr,

86

tr,

87

rl.linkrev(censorrev),

87

rl.linkrev(censorrev),

88

p1,

88

p1,

89

p2,

89

p2,

90

censornode,

90

censornode,

91

constants.REVIDX_ISCENSORED,

91

constants.REVIDX_ISCENSORED,

92

)

92

)

93

94

if newrl.deltaparent(rev) != nullrev:

94

if newrl.deltaparent(rev) != nullrev:

95

m = _(b'censored revision stored as delta; cannot censor')

95

m = _(b'censored revision stored as delta; cannot censor')

96

h = _(

96

h = _(

97

b'censoring of revlogs is not fully implemented;'

97

b'censoring of revlogs is not fully implemented;'

98

b' please report this bug'

98

b' please report this bug'

99

)

99

)

100

raise error.Abort(m, hint=h)

100

raise error.Abort(m, hint=h)

101

continue

101

continue

102

103

if rl.iscensored(rev):

103

if rl.iscensored(rev):

104

if rl.deltaparent(rev) != nullrev:

104

if rl.deltaparent(rev) != nullrev:

105

m = _(

105

m = _(

106

b'cannot censor due to censored '

106

b'cannot censor due to censored '

107

b'revision having delta stored'

107

b'revision having delta stored'

108

)

108

)

109

raise error.Abort(m)

109

raise error.Abort(m)

110

rawtext = rl._chunk(rev)

110

rawtext = rl._chunk(rev)

111

else:

111

else:

112

rawtext = rl.rawdata(rev)

112

rawtext = rl.rawdata(rev)

113

114

newrl.addrawrevision(

114

newrl.addrawrevision(

115

rawtext, tr, rl.linkrev(rev), p1, p2, node, rl.flags(rev)

115

rawtext, tr, rl.linkrev(rev), p1, p2, node, rl.flags(rev)

116

)

116

)

117

118

tr.addbackup(rl._indexfile, location=b'store')

118

tr.addbackup(rl._indexfile, location=b'store')

119

if not rl._inline:

119

if not rl._inline:

120

tr.addbackup(rl._datafile, location=b'store')

120

tr.addbackup(rl._datafile, location=b'store')

121

122

rl.opener.rename(newrl._indexfile, rl._indexfile)

122

rl.opener.rename(newrl._indexfile, rl._indexfile)

123

if not rl._inline:

123

if not rl._inline:

124

rl.opener.rename(newrl._datafile, rl._datafile)

124

rl.opener.rename(newrl._datafile, rl._datafile)

125

126

rl.clearcaches()

126

rl.clearcaches()

127

rl._loadindex()

127

rl._loadindex()

128

129

130

def v2_censor(revlog, tr, censornode, tombstone=b''):

130

def v2_censor(revlog, tr, censornode, tombstone=b''):

131

"""censors a revision in a "version 2" revlog"""

131

"""censors a revision in a "version 2" revlog"""

132

assert revlog._format_version != REVLOGV0, revlog._format_version

132

assert revlog._format_version != REVLOGV0, revlog._format_version

133

assert revlog._format_version != REVLOGV1, revlog._format_version

133

assert revlog._format_version != REVLOGV1, revlog._format_version

134

135

censor_revs = {revlog.rev(censornode)}

135

censor_revs = {revlog.rev(censornode)}

136

_rewrite_v2(revlog, tr, censor_revs, tombstone)

136

_rewrite_v2(revlog, tr, censor_revs, tombstone)

137

138

139

def _rewrite_v2(revlog, tr, censor_revs, tombstone=b''):

139

def _rewrite_v2(revlog, tr, censor_revs, tombstone=b''):

140

"""rewrite a revlog to censor some of its content

140

"""rewrite a revlog to censor some of its content

141

142

General principle

142

General principle

143

144

We create new revlog files (index/data/sidedata) to copy the content of

144

We create new revlog files (index/data/sidedata) to copy the content of

145

the existing data without the censored data.

145

the existing data without the censored data.

146

147

We need to recompute new delta for any revision that used the censored

147

We need to recompute new delta for any revision that used the censored

148

revision as delta base. As the cumulative size of the new delta may be

148

revision as delta base. As the cumulative size of the new delta may be

149

large, we store them in a temporary file until they are stored in their

149

large, we store them in a temporary file until they are stored in their

150

final destination.

150

final destination.

151

152

All data before the censored data can be blindly copied. The rest needs

152

All data before the censored data can be blindly copied. The rest needs

153

to be copied as we go and the associated index entry needs adjustement.

153

to be copied as we go and the associated index entry needs adjustement.

154

"""

154

"""

155

assert revlog._format_version != REVLOGV0, revlog._format_version

155

assert revlog._format_version != REVLOGV0, revlog._format_version

156

assert revlog._format_version != REVLOGV1, revlog._format_version

156

assert revlog._format_version != REVLOGV1, revlog._format_version

157

158

old_index = revlog.index

158

old_index = revlog.index

159

docket = revlog._docket

159

docket = revlog._docket

160

161

tombstone = storageutil.packmeta({b'censored': tombstone}, b'')

161

tombstone = storageutil.packmeta({b'censored': tombstone}, b'')

162

163

first_excl_rev = min(censor_revs)

163

first_excl_rev = min(censor_revs)

164

165

first_excl_entry = revlog.index[first_excl_rev]

165

first_excl_entry = revlog.index[first_excl_rev]

166

index_cutoff = revlog.index.entry_size * first_excl_rev

166

index_cutoff = revlog.index.entry_size * first_excl_rev

167

data_cutoff = first_excl_entry[ENTRY_DATA_OFFSET] >> 16

167

data_cutoff = first_excl_entry[ENTRY_DATA_OFFSET] >> 16

168

sidedata_cutoff = revlog.sidedata_cut_off(first_excl_rev)

168

sidedata_cutoff = revlog.sidedata_cut_off(first_excl_rev)

169

170

with pycompat.unnamedtempfile(mode=b"w+b") as tmp_storage:

170

with pycompat.unnamedtempfile(mode=b"w+b") as tmp_storage:

171

# rev → (new_base, data_start, data_end, compression_mode)

171

# rev → (new_base, data_start, data_end, compression_mode)

172

rewritten_entries = _precompute_rewritten_delta(

172

rewritten_entries = _precompute_rewritten_delta(

173

revlog,

173

revlog,

174

old_index,

174

old_index,

175

censor_revs,

175

censor_revs,

176

tmp_storage,

176

tmp_storage,

177

)

177

)

178

179

all_files = _setup_new_files(

179

all_files = _setup_new_files(

180

revlog,

180

revlog,

181

index_cutoff,

181

index_cutoff,

182

data_cutoff,

182

data_cutoff,

183

sidedata_cutoff,

183

sidedata_cutoff,

184

)

184

)

185

186

# we dont need to open the old index file since its content already

186

# we dont need to open the old index file since its content already

187

# exist in a usable form in `old_index`.

187

# exist in a usable form in `old_index`.

188

with all_files() as open_files:

188

with all_files() as open_files:

189

(

189

(

190

old_data_file,

190

old_data_file,

191

old_sidedata_file,

191

old_sidedata_file,

192

new_index_file,

192

new_index_file,

193

new_data_file,

193

new_data_file,

194

new_sidedata_file,

194

new_sidedata_file,

195

) = open_files

195

) = open_files

196

197

# writing the censored revision

197

# writing the censored revision

198

199

# Writing all subsequent revisions

199

# Writing all subsequent revisions

200

for rev in range(first_excl_rev, len(old_index)):

200

for rev in range(first_excl_rev, len(old_index)):

201

if rev in censor_revs:

201

if rev in censor_revs:

202

_rewrite_censor(

202

_rewrite_censor(

203

revlog,

203

revlog,

204

old_index,

204

old_index,

205

open_files,

205

open_files,

206

rev,

206

rev,

207

tombstone,

207

tombstone,

208

)

208

)

209

else:

209

else:

210

_rewrite_simple(

210

_rewrite_simple(

211

revlog,

211

revlog,

212

old_index,

212

old_index,

213

open_files,

213

open_files,

214

rev,

214

rev,

215

rewritten_entries,

215

rewritten_entries,

216

tmp_storage,

216

tmp_storage,

217

)

217

)

218

docket.write(transaction=None, stripping=True)

218

docket.write(transaction=None, stripping=True)

219

220

221

def _precompute_rewritten_delta(

221

def _precompute_rewritten_delta(

222

revlog,

222

revlog,

223

old_index,

223

old_index,

224

excluded_revs,

224

excluded_revs,

225

tmp_storage,

225

tmp_storage,

226

):

226

):

227

"""Compute new delta for revisions whose delta is based on revision that

227

"""Compute new delta for revisions whose delta is based on revision that

228

will not survive as is.

228

will not survive as is.

229

230

Return a mapping: {rev → (new_base, data_start, data_end, compression_mode)}

230

Return a mapping: {rev → (new_base, data_start, data_end, compression_mode)}

231

"""

231

"""

232

dc = deltas.deltacomputer(revlog)

232

dc = deltas.deltacomputer(revlog)

233

rewritten_entries = {}

233

rewritten_entries = {}

234

first_excl_rev = min(excluded_revs)

234

first_excl_rev = min(excluded_revs)

235

with revlog._segmentfile._open_read() as dfh:

235

with revlog._segmentfile._open_read() as dfh:

236

for rev in range(first_excl_rev, len(old_index)):

236

for rev in range(first_excl_rev, len(old_index)):

237

if rev in excluded_revs:

237

if rev in excluded_revs:

238

# this revision will be preserved as is, so we don't need to

238

# this revision will be preserved as is, so we don't need to

239

# consider recomputing a delta.

239

# consider recomputing a delta.

240

continue

240

continue

241

entry = old_index[rev]

241

entry = old_index[rev]

242

if entry[ENTRY_DELTA_BASE] not in excluded_revs:

242

if entry[ENTRY_DELTA_BASE] not in excluded_revs:

243

continue

243

continue

244

# This is a revision that use the censored revision as the base

244

# This is a revision that use the censored revision as the base

245

# for its delta. We need a need new deltas

245

# for its delta. We need a need new deltas

246

if entry[ENTRY_DATA_UNCOMPRESSED_LENGTH] == 0:

246

if entry[ENTRY_DATA_UNCOMPRESSED_LENGTH] == 0:

247

# this revision is empty, we can delta against nullrev

247

# this revision is empty, we can delta against nullrev

248

rewritten_entries[rev] = (nullrev, 0, 0, COMP_MODE_PLAIN)

248

rewritten_entries[rev] = (nullrev, 0, 0, COMP_MODE_PLAIN)

249

else:

249

else:

250

251

text = revlog.rawdata(rev, _df=dfh)

251

text = revlog.rawdata(rev, _df=dfh)

252

info = revlogutils.revisioninfo(

252

info = revlogutils.revisioninfo(

253

node=entry[ENTRY_NODE_ID],

253

node=entry[ENTRY_NODE_ID],

254

p1=revlog.node(entry[ENTRY_PARENT_1]),

254

p1=revlog.node(entry[ENTRY_PARENT_1]),

255

p2=revlog.node(entry[ENTRY_PARENT_2]),

255

p2=revlog.node(entry[ENTRY_PARENT_2]),

256

btext=[text],

256

btext=[text],

257

textlen=len(text),

257

textlen=len(text),

258

cachedelta=None,

258

cachedelta=None,

259

flags=entry[ENTRY_DATA_OFFSET] & 0xFFFF,

259

flags=entry[ENTRY_DATA_OFFSET] & 0xFFFF,

260

)

260

)

261

d = dc.finddeltainfo(

261

d = dc.finddeltainfo(

262

info, dfh, excluded_bases=excluded_revs, target_rev=rev

262

info, dfh, excluded_bases=excluded_revs, target_rev=rev

263

)

263

)

264

default_comp = revlog._docket.default_compression_header

264

default_comp = revlog._docket.default_compression_header

265

comp_mode, d = deltas.delta_compression(default_comp, d)

265

comp_mode, d = deltas.delta_compression(default_comp, d)

266

# using `tell` is a bit lazy, but we are not here for speed

266

# using `tell` is a bit lazy, but we are not here for speed

267

start = tmp_storage.tell()

267

start = tmp_storage.tell()

268

tmp_storage.write(d.data[1])

268

tmp_storage.write(d.data[1])

269

end = tmp_storage.tell()

269

end = tmp_storage.tell()

270

rewritten_entries[rev] = (d.base, start, end, comp_mode)

270

rewritten_entries[rev] = (d.base, start, end, comp_mode)

271

return rewritten_entries

271

return rewritten_entries

272

273

274

def _setup_new_files(

274

def _setup_new_files(

275

revlog,

275

revlog,

276

index_cutoff,

276

index_cutoff,

277

data_cutoff,

277

data_cutoff,

278

sidedata_cutoff,

278

sidedata_cutoff,

279

):

279

):

280

"""

280

"""

281

282

return a context manager to open all the relevant files:

282

return a context manager to open all the relevant files:

283

- old_data_file,

283

- old_data_file,

284

- old_sidedata_file,

284

- old_sidedata_file,

285

- new_index_file,

285

- new_index_file,

286

- new_data_file,

286

- new_data_file,

287

- new_sidedata_file,

287

- new_sidedata_file,

288

289

The old_index_file is not here because it is accessed through the

289

The old_index_file is not here because it is accessed through the

290

`old_index` object if the caller function.

290

`old_index` object if the caller function.

291

"""

291

"""

292

docket = revlog._docket

292

docket = revlog._docket

293

old_index_filepath = revlog.opener.join(docket.index_filepath())

293

old_index_filepath = revlog.opener.join(docket.index_filepath())

294

old_data_filepath = revlog.opener.join(docket.data_filepath())

294

old_data_filepath = revlog.opener.join(docket.data_filepath())

295

old_sidedata_filepath = revlog.opener.join(docket.sidedata_filepath())

295

old_sidedata_filepath = revlog.opener.join(docket.sidedata_filepath())

296

297

new_index_filepath = revlog.opener.join(docket.new_index_file())

297

new_index_filepath = revlog.opener.join(docket.new_index_file())

298

new_data_filepath = revlog.opener.join(docket.new_data_file())

298

new_data_filepath = revlog.opener.join(docket.new_data_file())

299

new_sidedata_filepath = revlog.opener.join(docket.new_sidedata_file())

299

new_sidedata_filepath = revlog.opener.join(docket.new_sidedata_file())

300

301

util.copyfile(old_index_filepath, new_index_filepath, nb_bytes=index_cutoff)

301

util.copyfile(old_index_filepath, new_index_filepath, nb_bytes=index_cutoff)

302

util.copyfile(old_data_filepath, new_data_filepath, nb_bytes=data_cutoff)

302

util.copyfile(old_data_filepath, new_data_filepath, nb_bytes=data_cutoff)

303

util.copyfile(

303

util.copyfile(

304

old_sidedata_filepath,

304

old_sidedata_filepath,

305

new_sidedata_filepath,

305

new_sidedata_filepath,

306

nb_bytes=sidedata_cutoff,

306

nb_bytes=sidedata_cutoff,

307

)

307

)

308

revlog.opener.register_file(docket.index_filepath())

308

revlog.opener.register_file(docket.index_filepath())

309

revlog.opener.register_file(docket.data_filepath())

309

revlog.opener.register_file(docket.data_filepath())

310

revlog.opener.register_file(docket.sidedata_filepath())

310

revlog.opener.register_file(docket.sidedata_filepath())

311

312

docket.index_end = index_cutoff

312

docket.index_end = index_cutoff

313

docket.data_end = data_cutoff

313

docket.data_end = data_cutoff

314

docket.sidedata_end = sidedata_cutoff

314

docket.sidedata_end = sidedata_cutoff

315

316

# reload the revlog internal information

316

# reload the revlog internal information

317

revlog.clearcaches()

317

revlog.clearcaches()

318

revlog._loadindex(docket=docket)

318

revlog._loadindex(docket=docket)

319

320

@contextlib.contextmanager

320

@contextlib.contextmanager

321

def all_files_opener():

321

def all_files_opener():

322

# hide opening in an helper function to please check-code, black

322

# hide opening in an helper function to please check-code, black

323

# and various python version at the same time

323

# and various python version at the same time

324

with open(old_data_filepath, 'rb') as old_data_file:

324

with open(old_data_filepath, 'rb') as old_data_file:

325

with open(old_sidedata_filepath, 'rb') as old_sidedata_file:

325

with open(old_sidedata_filepath, 'rb') as old_sidedata_file:

326

with open(new_index_filepath, 'r+b') as new_index_file:

326

with open(new_index_filepath, 'r+b') as new_index_file:

327

with open(new_data_filepath, 'r+b') as new_data_file:

327

with open(new_data_filepath, 'r+b') as new_data_file:

328

with open(

328

with open(

329

new_sidedata_filepath, 'r+b'

329

new_sidedata_filepath, 'r+b'

330

) as new_sidedata_file:

330

) as new_sidedata_file:

331

new_index_file.seek(0, os.SEEK_END)

331

new_index_file.seek(0, os.SEEK_END)

332

assert new_index_file.tell() == index_cutoff

332

assert new_index_file.tell() == index_cutoff

333

new_data_file.seek(0, os.SEEK_END)

333

new_data_file.seek(0, os.SEEK_END)

334

assert new_data_file.tell() == data_cutoff

334

assert new_data_file.tell() == data_cutoff

335

new_sidedata_file.seek(0, os.SEEK_END)

335

new_sidedata_file.seek(0, os.SEEK_END)

336

assert new_sidedata_file.tell() == sidedata_cutoff

336

assert new_sidedata_file.tell() == sidedata_cutoff

337

yield (

337

yield (

338

old_data_file,

338

old_data_file,

339

old_sidedata_file,

339

old_sidedata_file,

340

new_index_file,

340

new_index_file,

341

new_data_file,

341

new_data_file,

342

new_sidedata_file,

342

new_sidedata_file,

343

)

343

)

344

345

return all_files_opener

345

return all_files_opener

346

347

348

def _rewrite_simple(

348

def _rewrite_simple(

349

revlog,

349

revlog,

350

old_index,

350

old_index,

351

all_files,

351

all_files,

352

rev,

352

rev,

353

rewritten_entries,

353

rewritten_entries,

354

tmp_storage,

354

tmp_storage,

355

):

355

):

356

"""append a normal revision to the index after the rewritten one(s)"""

356

"""append a normal revision to the index after the rewritten one(s)"""

357

(

357

(

358

old_data_file,

358

old_data_file,

359

old_sidedata_file,

359

old_sidedata_file,

360

new_index_file,

360

new_index_file,

361

new_data_file,

361

new_data_file,

362

new_sidedata_file,

362

new_sidedata_file,

363

) = all_files

363

) = all_files

364

entry = old_index[rev]

364

entry = old_index[rev]

365

flags = entry[ENTRY_DATA_OFFSET] & 0xFFFF

365

flags = entry[ENTRY_DATA_OFFSET] & 0xFFFF

366

old_data_offset = entry[ENTRY_DATA_OFFSET] >> 16

366

old_data_offset = entry[ENTRY_DATA_OFFSET] >> 16

367

368

if rev not in rewritten_entries:

368

if rev not in rewritten_entries:

369

old_data_file.seek(old_data_offset)

369

old_data_file.seek(old_data_offset)

370

new_data_size = entry[ENTRY_DATA_COMPRESSED_LENGTH]

370

new_data_size = entry[ENTRY_DATA_COMPRESSED_LENGTH]

371

new_data = old_data_file.read(new_data_size)

371

new_data = old_data_file.read(new_data_size)

372

data_delta_base = entry[ENTRY_DELTA_BASE]

372

data_delta_base = entry[ENTRY_DELTA_BASE]

373

d_comp_mode = entry[ENTRY_DATA_COMPRESSION_MODE]

373

d_comp_mode = entry[ENTRY_DATA_COMPRESSION_MODE]

374

else:

374

else:

375

(

375

(

376

data_delta_base,

376

data_delta_base,

377

start,

377

start,

378

end,

378

end,

379

d_comp_mode,

379

d_comp_mode,

380

) = rewritten_entries[rev]

380

) = rewritten_entries[rev]

381

new_data_size = end - start

381

new_data_size = end - start

382

tmp_storage.seek(start)

382

tmp_storage.seek(start)

383

new_data = tmp_storage.read(new_data_size)

383

new_data = tmp_storage.read(new_data_size)

384

385

# It might be faster to group continuous read/write operation,

385

# It might be faster to group continuous read/write operation,

386

# however, this is censor, an operation that is not focussed

386

# however, this is censor, an operation that is not focussed

387

# around stellar performance. So I have not written this

387

# around stellar performance. So I have not written this

388

# optimisation yet.

388

# optimisation yet.

389

new_data_offset = new_data_file.tell()

389

new_data_offset = new_data_file.tell()

390

new_data_file.write(new_data)

390

new_data_file.write(new_data)

391

392

sidedata_size = entry[ENTRY_SIDEDATA_COMPRESSED_LENGTH]

392

sidedata_size = entry[ENTRY_SIDEDATA_COMPRESSED_LENGTH]

393

new_sidedata_offset = new_sidedata_file.tell()

393

new_sidedata_offset = new_sidedata_file.tell()

394

if 0 < sidedata_size:

394

if 0 < sidedata_size:

395

old_sidedata_offset = entry[ENTRY_SIDEDATA_OFFSET]

395

old_sidedata_offset = entry[ENTRY_SIDEDATA_OFFSET]

396

old_sidedata_file.seek(old_sidedata_offset)

396

old_sidedata_file.seek(old_sidedata_offset)

397

new_sidedata = old_sidedata_file.read(sidedata_size)

397

new_sidedata = old_sidedata_file.read(sidedata_size)

398

new_sidedata_file.write(new_sidedata)

398

new_sidedata_file.write(new_sidedata)

399

400

data_uncompressed_length = entry[ENTRY_DATA_UNCOMPRESSED_LENGTH]

400

data_uncompressed_length = entry[ENTRY_DATA_UNCOMPRESSED_LENGTH]

401

sd_com_mode = entry[ENTRY_SIDEDATA_COMPRESSION_MODE]

401

sd_com_mode = entry[ENTRY_SIDEDATA_COMPRESSION_MODE]

402

assert data_delta_base <= rev, (data_delta_base, rev)

402

assert data_delta_base <= rev, (data_delta_base, rev)

403

404

new_entry = revlogutils.entry(

404

new_entry = revlogutils.entry(

405

flags=flags,

405

flags=flags,

406

data_offset=new_data_offset,

406

data_offset=new_data_offset,

407

data_compressed_length=new_data_size,

407

data_compressed_length=new_data_size,

408

data_uncompressed_length=data_uncompressed_length,

408

data_uncompressed_length=data_uncompressed_length,

409

data_delta_base=data_delta_base,

409

data_delta_base=data_delta_base,

410

link_rev=entry[ENTRY_LINK_REV],

410

link_rev=entry[ENTRY_LINK_REV],

411

parent_rev_1=entry[ENTRY_PARENT_1],

411

parent_rev_1=entry[ENTRY_PARENT_1],

412

parent_rev_2=entry[ENTRY_PARENT_2],

412

parent_rev_2=entry[ENTRY_PARENT_2],

413

node_id=entry[ENTRY_NODE_ID],

413

node_id=entry[ENTRY_NODE_ID],

414

sidedata_offset=new_sidedata_offset,

414

sidedata_offset=new_sidedata_offset,

415

sidedata_compressed_length=sidedata_size,

415

sidedata_compressed_length=sidedata_size,

416

data_compression_mode=d_comp_mode,

416

data_compression_mode=d_comp_mode,

417

sidedata_compression_mode=sd_com_mode,

417

sidedata_compression_mode=sd_com_mode,

418

)

418

)

419

revlog.index.append(new_entry)

419

revlog.index.append(new_entry)

420

entry_bin = revlog.index.entry_binary(rev)

420

entry_bin = revlog.index.entry_binary(rev)

421

new_index_file.write(entry_bin)

421

new_index_file.write(entry_bin)

422

423

revlog._docket.index_end = new_index_file.tell()

423

revlog._docket.index_end = new_index_file.tell()

424

revlog._docket.data_end = new_data_file.tell()

424

revlog._docket.data_end = new_data_file.tell()

425

revlog._docket.sidedata_end = new_sidedata_file.tell()

425

revlog._docket.sidedata_end = new_sidedata_file.tell()

426

427

428

def _rewrite_censor(

428

def _rewrite_censor(

429

revlog,

429

revlog,

430

old_index,

430

old_index,

431

all_files,

431

all_files,

432

rev,

432

rev,

433

tombstone,

433

tombstone,

434

):

434

):

435

"""rewrite and append a censored revision"""

435

"""rewrite and append a censored revision"""

436

(

436

(

437

old_data_file,

437

old_data_file,

438

old_sidedata_file,

438

old_sidedata_file,

439

new_index_file,

439

new_index_file,

440

new_data_file,

440

new_data_file,

441

new_sidedata_file,

441

new_sidedata_file,

442

) = all_files

442

) = all_files

443

entry = old_index[rev]

443

entry = old_index[rev]

444

445

# XXX consider trying the default compression too

445

# XXX consider trying the default compression too

446

new_data_size = len(tombstone)

446

new_data_size = len(tombstone)

447

new_data_offset = new_data_file.tell()

447

new_data_offset = new_data_file.tell()

448

new_data_file.write(tombstone)

448

new_data_file.write(tombstone)

449

450

# we are not adding any sidedata as they might leak info about the censored version

450

# we are not adding any sidedata as they might leak info about the censored version

451

452

link_rev = entry[ENTRY_LINK_REV]

452

link_rev = entry[ENTRY_LINK_REV]

453

454

p1 = entry[ENTRY_PARENT_1]

454

p1 = entry[ENTRY_PARENT_1]

455

p2 = entry[ENTRY_PARENT_2]

455

p2 = entry[ENTRY_PARENT_2]

456

457

new_entry = revlogutils.entry(

457

new_entry = revlogutils.entry(

458

flags=constants.REVIDX_ISCENSORED,

458

flags=constants.REVIDX_ISCENSORED,

459

data_offset=new_data_offset,

459

data_offset=new_data_offset,

460

data_compressed_length=new_data_size,

460

data_compressed_length=new_data_size,

461

data_uncompressed_length=new_data_size,

461

data_uncompressed_length=new_data_size,

462

data_delta_base=rev,

462

data_delta_base=rev,

463

link_rev=link_rev,

463

link_rev=link_rev,

464

parent_rev_1=p1,

464

parent_rev_1=p1,

465

parent_rev_2=p2,

465

parent_rev_2=p2,

466

node_id=entry[ENTRY_NODE_ID],

466

node_id=entry[ENTRY_NODE_ID],

467

sidedata_offset=0,

467

sidedata_offset=0,

468

sidedata_compressed_length=0,

468

sidedata_compressed_length=0,

469

data_compression_mode=COMP_MODE_PLAIN,

469

data_compression_mode=COMP_MODE_PLAIN,

470

sidedata_compression_mode=COMP_MODE_PLAIN,

470

sidedata_compression_mode=COMP_MODE_PLAIN,

471

)

471

)

472

revlog.index.append(new_entry)

472

revlog.index.append(new_entry)

473

entry_bin = revlog.index.entry_binary(rev)

473

entry_bin = revlog.index.entry_binary(rev)

474

new_index_file.write(entry_bin)

474

new_index_file.write(entry_bin)

475

revlog._docket.index_end = new_index_file.tell()

475

revlog._docket.index_end = new_index_file.tell()

476

revlog._docket.data_end = new_data_file.tell()

476

revlog._docket.data_end = new_data_file.tell()

477

478

479

def _get_filename_from_filelog_index(path):

479

def _get_filename_from_filelog_index(path):

480

# Drop the extension and the `data/` prefix

480

# Drop the extension and the `data/` prefix

481

path_part = path.rsplit(b'.', 1)[0].split(b'/', 1)

481

path_part = path.rsplit(b'.', 1)[0].split(b'/', 1)

482

if len(path_part) < 2:

482

if len(path_part) < 2:

483

msg = _(b"cannot recognize filelog from filename: '%s'")

483

msg = _(b"cannot recognize filelog from filename: '%s'")

484

msg %= path

484

msg %= path

485

raise error.Abort(msg)

485

raise error.Abort(msg)

486

487

return path_part[1]

487

return path_part[1]

488

489

490

def _filelog_from_filename(repo, path):

490

def _filelog_from_filename(repo, path):

491

"""Returns the filelog for the given `path`. Stolen from `engine.py`"""

491

"""Returns the filelog for the given `path`. Stolen from `engine.py`"""

492

493

from .. import filelog # avoid cycle

493

from .. import filelog # avoid cycle

494

495

fl = filelog.filelog(repo.svfs, path)

495

fl = filelog.filelog(repo.svfs, path)

496

return fl

496

return fl

497

498

499

def _write_swapped_parents(repo, rl, rev, offset, fp):

499

def _write_swapped_parents(repo, rl, rev, offset, fp):

500

"""Swaps p1 and p2 and overwrites the revlog entry for `rev` in `fp`"""

500

"""Swaps p1 and p2 and overwrites the revlog entry for `rev` in `fp`"""

501

from ..pure import parsers # avoid cycle

501

from ..pure import parsers # avoid cycle

502

503

if repo._currentlock(repo._lockref) is None:

503

if repo._currentlock(repo._lockref) is None:

504

# Let's be paranoid about it

504

# Let's be paranoid about it

505

msg = "repo needs to be locked to rewrite parents"

505

msg = "repo needs to be locked to rewrite parents"

506

raise error.ProgrammingError(msg)

506

raise error.ProgrammingError(msg)

507

508

index_format = parsers.IndexObject.index_format

508

index_format = parsers.IndexObject.index_format

509

entry = rl.index[rev]

509

entry = rl.index[rev]

510

new_entry = list(entry)

510

new_entry = list(entry)

511

new_entry[5], new_entry[6] = entry[6], entry[5]

511

new_entry[5], new_entry[6] = entry[6], entry[5]

512

packed = index_format.pack(*new_entry[:8])

512

packed = index_format.pack(*new_entry[:8])

513

fp.seek(offset)

513

fp.seek(offset)

514

fp.write(packed)

514

fp.write(packed)

515

516

517

def _reorder_filelog_parents(repo, fl, to_fix):

517

def _reorder_filelog_parents(repo, fl, to_fix):

518

"""

518

"""

519

Swaps p1 and p2 for all `to_fix` revisions of filelog `fl` and writes the

519

Swaps p1 and p2 for all `to_fix` revisions of filelog `fl` and writes the

520

new version to disk, overwriting the old one with a rename.

520

new version to disk, overwriting the old one with a rename.

521

"""

521

"""

522

from ..pure import parsers # avoid cycle

522

from ..pure import parsers # avoid cycle

523

524

ui = repo.ui

524

ui = repo.ui

525

assert len(to_fix) > 0

525

assert len(to_fix) > 0

526

rl = fl._revlog

526

rl = fl._revlog

527

if rl._format_version != constants.REVLOGV1:

527

if rl._format_version != constants.REVLOGV1:

528

msg = "expected version 1 revlog, got version '%d'" % rl._format_version

528

msg = "expected version 1 revlog, got version '%d'" % rl._format_version

529

raise error.ProgrammingError(msg)

529

raise error.ProgrammingError(msg)

530

531

index_file = rl._indexfile

531

index_file = rl._indexfile

532

new_file_path = index_file + b'.tmp-parents-fix'

532

new_file_path = index_file + b'.tmp-parents-fix'

533

repaired_msg = _(b"repaired revision %d of 'filelog %s'\n")

533

repaired_msg = _(b"repaired revision %d of 'filelog %s'\n")

534

535

with ui.uninterruptible():

535

with ui.uninterruptible():

536

try:

536

try:

537

util.copyfile(

537

util.copyfile(

538

rl.opener.join(index_file),

538

rl.opener.join(index_file),

539

rl.opener.join(new_file_path),

539

rl.opener.join(new_file_path),

540

checkambig=rl._checkambig,

540

checkambig=rl._checkambig,

541

)

541

)

542

543

with rl.opener(new_file_path, mode=b"r+") as fp:

543

with rl.opener(new_file_path, mode=b"r+") as fp:

544

if rl._inline:

544

if rl._inline:

545

index = parsers.InlinedIndexObject(fp.read())

545

index = parsers.InlinedIndexObject(fp.read())

546

for rev in fl.revs():

546

for rev in fl.revs():

547

if rev in to_fix:

547

if rev in to_fix:

548

offset = index._calculate_index(rev)

548

offset = index._calculate_index(rev)

549

_write_swapped_parents(repo, rl, rev, offset, fp)

549

_write_swapped_parents(repo, rl, rev, offset, fp)

550

ui.write(repaired_msg % (rev, index_file))

550

ui.write(repaired_msg % (rev, index_file))

551

else:

551

else:

552

index_format = parsers.IndexObject.index_format

552

index_format = parsers.IndexObject.index_format

553

for rev in to_fix:

553

for rev in to_fix:

554

offset = rev * index_format.size

554

offset = rev * index_format.size

555

_write_swapped_parents(repo, rl, rev, offset, fp)

555

_write_swapped_parents(repo, rl, rev, offset, fp)

556

ui.write(repaired_msg % (rev, index_file))

556

ui.write(repaired_msg % (rev, index_file))

557

558

rl.opener.rename(new_file_path, index_file)

558

rl.opener.rename(new_file_path, index_file)

559

rl.clearcaches()

559

rl.clearcaches()

560

rl._loadindex()

560

rl._loadindex()

561

finally:

561

finally:

562

util.tryunlink(new_file_path)

562

util.tryunlink(new_file_path)

563

564

565

def _is_revision_affected(fl, filerev, metadata_cache=None):

565

def _is_revision_affected(fl, filerev, metadata_cache=None):

566

full_text = lambda: fl._revlog.rawdata(filerev)

566

full_text = lambda: fl._revlog.rawdata(filerev)

567

parent_revs = lambda: fl._revlog.parentrevs(filerev)

567

parent_revs = lambda: fl._revlog.parentrevs(filerev)

568

return _is_revision_affected_inner(

568

return _is_revision_affected_inner(

569

full_text, parent_revs, filerev, metadata_cache

569

full_text, parent_revs, filerev, metadata_cache

570

)

570

)

571

572

573

def _is_revision_affected_inner(

573

def _is_revision_affected_inner(

574

full_text,

574

full_text,

575

parents_revs,

575

parents_revs,

576

filerev,

576

filerev,

577

metadata_cache=None,

577

metadata_cache=None,

578

):

578

):

579

"""Mercurial currently (5.9rc0) uses `p1 == nullrev and p2 != nullrev` as a

579

"""Mercurial currently (5.9rc0) uses `p1 == nullrev and p2 != nullrev` as a

580

special meaning compared to the reverse in the context of filelog-based

580

special meaning compared to the reverse in the context of filelog-based

581

copytracing. issue6528 exists because new code assumed that parent ordering

581

copytracing. issue6528 exists because new code assumed that parent ordering

582

didn't matter, so this detects if the revision contains metadata (since

582

didn't matter, so this detects if the revision contains metadata (since

583

it's only used for filelog-based copytracing) and its parents are in the

583

it's only used for filelog-based copytracing) and its parents are in the

584

"wrong" order."""

584

"wrong" order."""

585

try:

585

try:

586

raw_text = full_text()

586

raw_text = full_text()

587

except error.CensoredNodeError:

587

except error.CensoredNodeError:

588

# We don't care about censored nodes as they never carry metadata

588

# We don't care about censored nodes as they never carry metadata

589

return False

589

return False

590

has_meta = raw_text.startswith(b'\x01\n')

590

has_meta = raw_text.startswith(b'\x01\n')

591

if metadata_cache is not None:

591

if metadata_cache is not None:

592

metadata_cache[filerev] = has_meta

592

metadata_cache[filerev] = has_meta

593

if has_meta:

593

if has_meta:

594

(p1, p2) = parents_revs()

594

(p1, p2) = parents_revs()

595

if p1 != nullrev and p2 == nullrev:

595

if p1 != nullrev and p2 == nullrev:

596

return True

596

return True

597

return False

597

return False

598

599

600

def _is_revision_affected_fast(repo, fl, filerev, metadata_cache):

600

def _is_revision_affected_fast(repo, fl, filerev, metadata_cache):

601

rl = fl._revlog

602

is_censored = lambda: rl.iscensored(filerev)

603

delta_base = lambda: rl.deltaparent(filerev)

604

delta = lambda: rl._chunk(filerev)

605

full_text = lambda: rl.rawdata(filerev)

606

parent_revs = lambda: rl.parentrevs(filerev)

607

return _is_revision_affected_fast_inner(

608

is_censored,

609

delta_base,

610

delta,

611

full_text,

612

parent_revs,

613

filerev,

614

metadata_cache,

615

)

616

617

618

def _is_revision_affected_fast_inner(

619

is_censored,

620

delta_base,

621

delta,

622

full_text,

623

parent_revs,

624

filerev,

625

metadata_cache,

626

):

601

"""Optimization fast-path for `_is_revision_affected`.

627

"""Optimization fast-path for `_is_revision_affected`.

602

628

603

`metadata_cache` is a dict of `{rev: has_metadata}` which allows any

629

`metadata_cache` is a dict of `{rev: has_metadata}` which allows any

604

revision to check if its base has metadata, saving computation of the full

630

revision to check if its base has metadata, saving computation of the full

605

text, instead looking at the current delta.

631

text, instead looking at the current delta.

606

632

607

This optimization only works if the revisions are looked at in order."""

633

This optimization only works if the revisions are looked at in order."""

608

rl = fl._revlog

609

634

610

if rl.iscensored(~~filerev~~):

635

if is_censored():

611

# Censored revisions don't contain metadata, so they cannot be affected

636

# Censored revisions don't contain metadata, so they cannot be affected

612

metadata_cache[filerev] = False

637

metadata_cache[filerev] = False

613

return False

638

return False

614

639

615

p1, p2 = rl.parentrevs(~~filerev~~)

640

p1, p2 = parent_revs()

616

if p1 == nullrev or p2 != nullrev:

641

if p1 == nullrev or p2 != nullrev:

617

return False

642

return False

618

643

619

delta_parent = rl.~~deltaparent~~(~~filerev~~)

644

delta_parent = delta_base()

620

parent_has_metadata = metadata_cache.get(delta_parent)

645

parent_has_metadata = metadata_cache.get(delta_parent)

621

if parent_has_metadata is None:

646

if parent_has_metadata is None:

622

~~is_affected~~ = _is_revision_affected(fl, ~~filerev~~, ~~metadata_cache~~)

647

return _is_revision_affected_inner(

623

return is_affected

648

full_text,

649

parent_revs,

650

filerev,

651

metadata_cache,

652

)

624

653

625

chunk = rl.~~_chunk~~(~~filerev~~)

654

chunk = delta()

626

if not len(chunk):

655

if not len(chunk):

627

# No diff for this revision

656

# No diff for this revision

628

return parent_has_metadata

657

return parent_has_metadata

629

658

630

header_length = 12

659

header_length = 12

631

if len(chunk) < header_length:

660

if len(chunk) < header_length:

632

raise error.Abort(_(b"patch cannot be decoded"))

661

raise error.Abort(_(b"patch cannot be decoded"))

633

662

634

start, _end, _length = struct.unpack(b">lll", chunk[:header_length])

663

start, _end, _length = struct.unpack(b">lll", chunk[:header_length])

635

664

636

if start < 2: # len(b'\x01\n') == 2

665

if start < 2: # len(b'\x01\n') == 2

637

# This delta does *something* to the metadata marker (if any).

666

# This delta does *something* to the metadata marker (if any).

638

# Check it the slow way

667

# Check it the slow way

639

is_affected = _is_revision_affected(fl, ~~filerev~~, ~~metadata_cache~~)

668

is_affected = _is_revision_affected_inner(

669

full_text,

670

parent_revs,

671

filerev,

672

metadata_cache,

673

)

640

return is_affected

674

return is_affected

641

675

642

# The diff did not remove or add the metadata header, it's then in the same

676

# The diff did not remove or add the metadata header, it's then in the same

643

# situation as its parent

677

# situation as its parent

644

metadata_cache[filerev] = parent_has_metadata

678

metadata_cache[filerev] = parent_has_metadata

645

return parent_has_metadata

679

return parent_has_metadata

646

680

647

681

648

def _from_report(ui, repo, context, from_report, dry_run):

682

def _from_report(ui, repo, context, from_report, dry_run):

649

"""

683

"""

650

Fix the revisions given in the `from_report` file, but still checks if the

684

Fix the revisions given in the `from_report` file, but still checks if the

651

revisions are indeed affected to prevent an unfortunate cyclic situation

685

revisions are indeed affected to prevent an unfortunate cyclic situation

652

where we'd swap well-ordered parents again.

686

where we'd swap well-ordered parents again.

653

687

654

See the doc for `debug_fix_issue6528` for the format documentation.

688

See the doc for `debug_fix_issue6528` for the format documentation.

655

"""

689

"""

656

ui.write(_(b"loading report file '%s'\n") % from_report)

690

ui.write(_(b"loading report file '%s'\n") % from_report)

657

691

658

with context(), open(from_report, mode='rb') as f:

692

with context(), open(from_report, mode='rb') as f:

659

for line in f.read().split(b'\n'):

693

for line in f.read().split(b'\n'):

660

if not line:

694

if not line:

661

continue

695

continue

662

filenodes, filename = line.split(b' ', 1)

696

filenodes, filename = line.split(b' ', 1)

663

fl = _filelog_from_filename(repo, filename)

697

fl = _filelog_from_filename(repo, filename)

664

to_fix = set(

698

to_fix = set(

665

fl.rev(binascii.unhexlify(n)) for n in filenodes.split(b',')

699

fl.rev(binascii.unhexlify(n)) for n in filenodes.split(b',')

666

)

700

)

667

excluded = set()

701

excluded = set()

668

702

669

for filerev in to_fix:

703

for filerev in to_fix:

670

if _is_revision_affected(fl, filerev):

704

if _is_revision_affected(fl, filerev):

671

msg = b"found affected revision %d for filelog '%s'\n"

705

msg = b"found affected revision %d for filelog '%s'\n"

672

ui.warn(msg % (filerev, filename))

706

ui.warn(msg % (filerev, filename))

673

else:

707

else:

674

msg = _(b"revision %s of file '%s' is not affected\n")

708

msg = _(b"revision %s of file '%s' is not affected\n")

675

msg %= (binascii.hexlify(fl.node(filerev)), filename)

709

msg %= (binascii.hexlify(fl.node(filerev)), filename)

676

ui.warn(msg)

710

ui.warn(msg)

677

excluded.add(filerev)

711

excluded.add(filerev)

678

712

679

to_fix = to_fix - excluded

713

to_fix = to_fix - excluded

680

if not to_fix:

714

if not to_fix:

681

msg = _(b"no affected revisions were found for '%s'\n")

715

msg = _(b"no affected revisions were found for '%s'\n")

682

ui.write(msg % filename)

716

ui.write(msg % filename)

683

continue

717

continue

684

if not dry_run:

718

if not dry_run:

685

_reorder_filelog_parents(repo, fl, sorted(to_fix))

719

_reorder_filelog_parents(repo, fl, sorted(to_fix))

686

720

687

721

688

def repair_issue6528(

722

def repair_issue6528(

689

ui, repo, dry_run=False, to_report=None, from_report=None, paranoid=False

723

ui, repo, dry_run=False, to_report=None, from_report=None, paranoid=False

690

):

724

):

691

from .. import store # avoid cycle

725

from .. import store # avoid cycle

692

726

693

@contextlib.contextmanager

727

@contextlib.contextmanager

694

def context():

728

def context():

695

if dry_run or to_report: # No need for locking

729

if dry_run or to_report: # No need for locking

696

yield

730

yield

697

else:

731

else:

698

with repo.wlock(), repo.lock():

732

with repo.wlock(), repo.lock():

699

yield

733

yield

700

734

701

if from_report:

735

if from_report:

702

return _from_report(ui, repo, context, from_report, dry_run)

736

return _from_report(ui, repo, context, from_report, dry_run)

703

737

704

report_entries = []

738

report_entries = []

705

739

706

with context():

740

with context():

707

files = list(

741

files = list(

708

(file_type, path)

742

(file_type, path)

709

for (file_type, path, _e, _s) in repo.store.datafiles()

743

for (file_type, path, _e, _s) in repo.store.datafiles()

710

if path.endswith(b'.i') and file_type & store.FILEFLAGS_FILELOG

744

if path.endswith(b'.i') and file_type & store.FILEFLAGS_FILELOG

711

)

745

)

712

746

713

progress = ui.makeprogress(

747

progress = ui.makeprogress(

714

_(b"looking for affected revisions"),

748

_(b"looking for affected revisions"),

715

unit=_(b"filelogs"),

749

unit=_(b"filelogs"),

716

total=len(files),

750

total=len(files),

717

)

751

)

718

found_nothing = True

752

found_nothing = True

719

753

720

for file_type, path in files:

754

for file_type, path in files:

721

if (

755

if (

722

not path.endswith(b'.i')

756

not path.endswith(b'.i')

723

or not file_type & store.FILEFLAGS_FILELOG

757

or not file_type & store.FILEFLAGS_FILELOG

724

):

758

):

725

continue

759

continue

726

progress.increment()

760

progress.increment()

727

filename = _get_filename_from_filelog_index(path)

761

filename = _get_filename_from_filelog_index(path)

728

fl = _filelog_from_filename(repo, filename)

762

fl = _filelog_from_filename(repo, filename)

729

763

730

# Set of filerevs (or hex filenodes if `to_report`) that need fixing

764

# Set of filerevs (or hex filenodes if `to_report`) that need fixing

731

to_fix = set()

765

to_fix = set()

732

metadata_cache = {}

766

metadata_cache = {}

733

for filerev in fl.revs():

767

for filerev in fl.revs():

734

affected = _is_revision_affected_fast(

768

affected = _is_revision_affected_fast(

735

repo, fl, filerev, metadata_cache

769

repo, fl, filerev, metadata_cache

736

)

770

)

737

if paranoid:

771

if paranoid:

738

slow = _is_revision_affected(fl, filerev)

772

slow = _is_revision_affected(fl, filerev)

739

if slow != affected:

773

if slow != affected:

740

msg = _(b"paranoid check failed for '%s' at node %s")

774

msg = _(b"paranoid check failed for '%s' at node %s")

741

node = binascii.hexlify(fl.node(filerev))

775

node = binascii.hexlify(fl.node(filerev))

742

raise error.Abort(msg % (filename, node))

776

raise error.Abort(msg % (filename, node))

743

if affected:

777

if affected:

744

msg = b"found affected revision %d for filelog '%s'\n"

778

msg = b"found affected revision %d for filelog '%s'\n"

745

ui.warn(msg % (filerev, path))

779

ui.warn(msg % (filerev, path))

746

found_nothing = False

780

found_nothing = False

747

if not dry_run:

781

if not dry_run:

748

if to_report:

782

if to_report:

749

to_fix.add(binascii.hexlify(fl.node(filerev)))

783

to_fix.add(binascii.hexlify(fl.node(filerev)))

750

else:

784

else:

751

to_fix.add(filerev)

785

to_fix.add(filerev)

752

786

753

if to_fix:

787

if to_fix:

754

to_fix = sorted(to_fix)

788

to_fix = sorted(to_fix)

755

if to_report:

789

if to_report:

756

report_entries.append((filename, to_fix))

790

report_entries.append((filename, to_fix))

757

else:

791

else:

758

_reorder_filelog_parents(repo, fl, to_fix)

792

_reorder_filelog_parents(repo, fl, to_fix)

759

793

760

if found_nothing:

794

if found_nothing:

761

ui.write(_(b"no affected revisions were found\n"))

795

ui.write(_(b"no affected revisions were found\n"))

762

796

763

if to_report and report_entries:

797

if to_report and report_entries:

764

with open(to_report, mode="wb") as f:

798

with open(to_report, mode="wb") as f:

765

for path, to_fix in report_entries:

799

for path, to_fix in report_entries:

766

f.write(b"%s %s\n" % (b",".join(to_fix), path))

800

f.write(b"%s %s\n" % (b",".join(to_fix), path))

767

801

768

progress.complete()

802

progress.complete()

	Site-wide shortcuts
/	Use quick search box
g h	Goto home page
g g	Goto my private gists page
g G	Goto my public gists page
g 0-9	Goto bookmarked items from 0-9
n r	New repository page
n g	New gist page

	Repositories
g s	Goto summary page
g c	Goto changelog page
g f	Goto files page
g F	Goto files page with file search activated
g p	Goto pull requests page
g o	Goto repository settings
g O	Goto repository access permissions settings
t s	Toggle sidebar on some pages

             # censor code related to censoring revision
             # coding: utf8
             #
             # Copyright 2021 Pierre-Yves David <pierre-yves.david@octobus.net>
             # Copyright 2015 Google, Inc <martinvonz@google.com>
             #
             # This software may be used and distributed according to the terms of the
             # GNU General Public License version 2 or any later version.
             import binascii
             import contextlib
             import os
             import struct
             from ..node import (
                 nullrev,
             )
             from .constants import (
                 COMP_MODE_PLAIN,
                 ENTRY_DATA_COMPRESSED_LENGTH,
                 ENTRY_DATA_COMPRESSION_MODE,
                 ENTRY_DATA_OFFSET,
                 ENTRY_DATA_UNCOMPRESSED_LENGTH,
                 ENTRY_DELTA_BASE,
                 ENTRY_LINK_REV,
                 ENTRY_NODE_ID,
                 ENTRY_PARENT_1,
                 ENTRY_PARENT_2,
                 ENTRY_SIDEDATA_COMPRESSED_LENGTH,
                 ENTRY_SIDEDATA_COMPRESSION_MODE,
                 ENTRY_SIDEDATA_OFFSET,
                 REVLOGV0,
                 REVLOGV1,
             )
             from ..i18n import _
             from .. import (
                 error,
                 pycompat,
                 revlogutils,
                 util,
             )
             from ..utils import (
                 storageutil,
             )
             from . import (
                 constants,
                 deltas,
             )
             def v1_censor(rl, tr, censornode, tombstone=b''):
                 """censors a revision in a "version 1" revlog"""
                 assert rl._format_version == constants.REVLOGV1, rl._format_version
                 # avoid cycle
                 from .. import revlog
                 censorrev = rl.rev(censornode)
                 tombstone = storageutil.packmeta({b'censored': tombstone}, b'')
                 # Rewriting the revlog in place is hard. Our strategy for censoring is
                 # to create a new revlog, copy all revisions to it, then replace the
                 # revlogs on transaction close.
                 #
                 # This is a bit dangerous. We could easily have a mismatch of state.
                 newrl = revlog.revlog(
                     rl.opener,
                     target=rl.target,
                     radix=rl.radix,
                     postfix=b'tmpcensored',
                     censorable=True,
                 )
                 newrl._format_version = rl._format_version
                 newrl._format_flags = rl._format_flags
                 newrl._generaldelta = rl._generaldelta
                 newrl._parse_index = rl._parse_index
                 for rev in rl.revs():
                     node = rl.node(rev)
                     p1, p2 = rl.parents(node)
                     if rev == censorrev:
                         newrl.addrawrevision(
                             tombstone,
                             tr,
                             rl.linkrev(censorrev),
                             p1,
                             p2,
                             censornode,
                             constants.REVIDX_ISCENSORED,
                         )
                         if newrl.deltaparent(rev) != nullrev:
                             m = _(b'censored revision stored as delta; cannot censor')
                             h = _(
                                 b'censoring of revlogs is not fully implemented;'
                                 b' please report this bug'
                             )
                             raise error.Abort(m, hint=h)
                         continue
                     if rl.iscensored(rev):
                         if rl.deltaparent(rev) != nullrev:
                             m = _(
                                 b'cannot censor due to censored '
                                 b'revision having delta stored'
                             )
                             raise error.Abort(m)
                         rawtext = rl._chunk(rev)
                     else:
                         rawtext = rl.rawdata(rev)
                     newrl.addrawrevision(
                         rawtext, tr, rl.linkrev(rev), p1, p2, node, rl.flags(rev)
                     )
                 tr.addbackup(rl._indexfile, location=b'store')
                 if not rl._inline:
                     tr.addbackup(rl._datafile, location=b'store')
                 rl.opener.rename(newrl._indexfile, rl._indexfile)
                 if not rl._inline:
                     rl.opener.rename(newrl._datafile, rl._datafile)
                 rl.clearcaches()
                 rl._loadindex()
             def v2_censor(revlog, tr, censornode, tombstone=b''):
                 """censors a revision in a "version 2" revlog"""
                 assert revlog._format_version != REVLOGV0, revlog._format_version
                 assert revlog._format_version != REVLOGV1, revlog._format_version
                 censor_revs = {revlog.rev(censornode)}
                 _rewrite_v2(revlog, tr, censor_revs, tombstone)
             def _rewrite_v2(revlog, tr, censor_revs, tombstone=b''):
                 """rewrite a revlog to censor some of its content
                 General principle
                 We create new revlog files (index/data/sidedata) to copy the content of
                 the existing data without the censored data.
                 We need to recompute new delta for any revision that used the censored
                 revision as delta base. As the cumulative size of the new delta may be
                 large, we store them in a temporary file until they are stored in their
                 final destination.
                 All data before the censored data can be blindly copied. The rest needs
                 to be copied as we go and the associated index entry needs adjustement.
                 """
                 assert revlog._format_version != REVLOGV0, revlog._format_version
                 assert revlog._format_version != REVLOGV1, revlog._format_version
                 old_index = revlog.index
                 docket = revlog._docket
                 tombstone = storageutil.packmeta({b'censored': tombstone}, b'')
                 first_excl_rev = min(censor_revs)
                 first_excl_entry = revlog.index[first_excl_rev]
                 index_cutoff = revlog.index.entry_size * first_excl_rev
                 data_cutoff = first_excl_entry[ENTRY_DATA_OFFSET] >> 16
                 sidedata_cutoff = revlog.sidedata_cut_off(first_excl_rev)
                 with pycompat.unnamedtempfile(mode=b"w+b") as tmp_storage:
                     # rev → (new_base, data_start, data_end, compression_mode)
                     rewritten_entries = _precompute_rewritten_delta(
                         revlog,
                         old_index,
                         censor_revs,
                         tmp_storage,
                     )
                     all_files = _setup_new_files(
                         revlog,
                         index_cutoff,
                         data_cutoff,
                         sidedata_cutoff,
                     )
                     # we dont need to open the old index file since its content already
                     # exist in a usable form in `old_index`.
                     with all_files() as open_files:
                         (
                             old_data_file,
                             old_sidedata_file,
                             new_index_file,
                             new_data_file,
                             new_sidedata_file,
                         ) = open_files
                         # writing the censored revision
                         # Writing all subsequent revisions
                         for rev in range(first_excl_rev, len(old_index)):
                             if rev in censor_revs:
                                 _rewrite_censor(
                                     revlog,
                                     old_index,
                                     open_files,
                                     rev,
                                     tombstone,
                                 )
                             else:
                                 _rewrite_simple(
                                     revlog,
                                     old_index,
                                     open_files,
                                     rev,
                                     rewritten_entries,
                                     tmp_storage,
                                 )
                 docket.write(transaction=None, stripping=True)
             def _precompute_rewritten_delta(
                 revlog,
                 old_index,
                 excluded_revs,
                 tmp_storage,
             ):
                 """Compute new delta for revisions whose delta is based on revision that
                 will not survive as is.
                 Return a mapping: {rev → (new_base, data_start, data_end, compression_mode)}
                 """
                 dc = deltas.deltacomputer(revlog)
                 rewritten_entries = {}
                 first_excl_rev = min(excluded_revs)
                 with revlog._segmentfile._open_read() as dfh:
                     for rev in range(first_excl_rev, len(old_index)):
                         if rev in excluded_revs:
                             # this revision will be preserved as is, so we don't need to
                             # consider recomputing a delta.
                             continue
                         entry = old_index[rev]
                         if entry[ENTRY_DELTA_BASE] not in excluded_revs:
                             continue
                         # This is a revision that use the censored revision as the base
                         # for its delta. We need a need new deltas
                         if entry[ENTRY_DATA_UNCOMPRESSED_LENGTH] == 0:
                             # this revision is empty, we can delta against nullrev
                             rewritten_entries[rev] = (nullrev, 0, 0, COMP_MODE_PLAIN)
                         else:
                             text = revlog.rawdata(rev, _df=dfh)
                             info = revlogutils.revisioninfo(
                                 node=entry[ENTRY_NODE_ID],
                                 p1=revlog.node(entry[ENTRY_PARENT_1]),
                                 p2=revlog.node(entry[ENTRY_PARENT_2]),
                                 btext=[text],
                                 textlen=len(text),
                                 cachedelta=None,
                                 flags=entry[ENTRY_DATA_OFFSET] & 0xFFFF,
                             )
                             d = dc.finddeltainfo(
                                 info, dfh, excluded_bases=excluded_revs, target_rev=rev
                             )
                             default_comp = revlog._docket.default_compression_header
                             comp_mode, d = deltas.delta_compression(default_comp, d)
                             # using `tell` is a bit lazy, but we are not here for speed
                             start = tmp_storage.tell()
                             tmp_storage.write(d.data[1])
                             end = tmp_storage.tell()
                             rewritten_entries[rev] = (d.base, start, end, comp_mode)
                 return rewritten_entries
             def _setup_new_files(
                 revlog,
                 index_cutoff,
                 data_cutoff,
                 sidedata_cutoff,
             ):
                 """
                 return a context manager to open all the relevant files:
                 - old_data_file,
                 - old_sidedata_file,
                 - new_index_file,
                 - new_data_file,
                 - new_sidedata_file,
                 The old_index_file is not here because it is accessed through the
                 `old_index` object if the caller function.
                 """
                 docket = revlog._docket
                 old_index_filepath = revlog.opener.join(docket.index_filepath())
                 old_data_filepath = revlog.opener.join(docket.data_filepath())
                 old_sidedata_filepath = revlog.opener.join(docket.sidedata_filepath())
                 new_index_filepath = revlog.opener.join(docket.new_index_file())
                 new_data_filepath = revlog.opener.join(docket.new_data_file())
                 new_sidedata_filepath = revlog.opener.join(docket.new_sidedata_file())
                 util.copyfile(old_index_filepath, new_index_filepath, nb_bytes=index_cutoff)
                 util.copyfile(old_data_filepath, new_data_filepath, nb_bytes=data_cutoff)
                 util.copyfile(
                     old_sidedata_filepath,
                     new_sidedata_filepath,
                     nb_bytes=sidedata_cutoff,
                 )
                 revlog.opener.register_file(docket.index_filepath())
                 revlog.opener.register_file(docket.data_filepath())
                 revlog.opener.register_file(docket.sidedata_filepath())
                 docket.index_end = index_cutoff
                 docket.data_end = data_cutoff
                 docket.sidedata_end = sidedata_cutoff
                 # reload the revlog internal information
                 revlog.clearcaches()
                 revlog._loadindex(docket=docket)
                 @contextlib.contextmanager
                 def all_files_opener():
                     # hide opening in an helper function to please check-code, black
                     # and various python version at the same time
                     with open(old_data_filepath, 'rb') as old_data_file:
                         with open(old_sidedata_filepath, 'rb') as old_sidedata_file:
                             with open(new_index_filepath, 'r+b') as new_index_file:
                                 with open(new_data_filepath, 'r+b') as new_data_file:
                                     with open(
                                         new_sidedata_filepath, 'r+b'
                                     ) as new_sidedata_file:
                                         new_index_file.seek(0, os.SEEK_END)
                                         assert new_index_file.tell() == index_cutoff
                                         new_data_file.seek(0, os.SEEK_END)
                                         assert new_data_file.tell() == data_cutoff
                                         new_sidedata_file.seek(0, os.SEEK_END)
                                         assert new_sidedata_file.tell() == sidedata_cutoff
                                         yield (
                                             old_data_file,
                                             old_sidedata_file,
                                             new_index_file,
                                             new_data_file,
                                             new_sidedata_file,
                                         )
                 return all_files_opener
             def _rewrite_simple(
                 revlog,
                 old_index,
                 all_files,
                 rev,
                 rewritten_entries,
                 tmp_storage,
             ):
                 """append a normal revision to the index after the rewritten one(s)"""
                 (
                     old_data_file,
                     old_sidedata_file,
                     new_index_file,
                     new_data_file,
                     new_sidedata_file,
                 ) = all_files
                 entry = old_index[rev]
                 flags = entry[ENTRY_DATA_OFFSET] & 0xFFFF
                 old_data_offset = entry[ENTRY_DATA_OFFSET] >> 16
                 if rev not in rewritten_entries:
                     old_data_file.seek(old_data_offset)
                     new_data_size = entry[ENTRY_DATA_COMPRESSED_LENGTH]
                     new_data = old_data_file.read(new_data_size)
                     data_delta_base = entry[ENTRY_DELTA_BASE]
                     d_comp_mode = entry[ENTRY_DATA_COMPRESSION_MODE]
                 else:
                     (
                         data_delta_base,
                         start,
                         end,
                         d_comp_mode,
                     ) = rewritten_entries[rev]
                     new_data_size = end - start
                     tmp_storage.seek(start)
                     new_data = tmp_storage.read(new_data_size)
                 # It might be faster to group continuous read/write operation,
                 # however, this is censor, an operation that is not focussed
                 # around stellar performance. So I have not written this
                 # optimisation yet.
                 new_data_offset = new_data_file.tell()
                 new_data_file.write(new_data)
                 sidedata_size = entry[ENTRY_SIDEDATA_COMPRESSED_LENGTH]
                 new_sidedata_offset = new_sidedata_file.tell()
                 if 0 < sidedata_size:
                     old_sidedata_offset = entry[ENTRY_SIDEDATA_OFFSET]
                     old_sidedata_file.seek(old_sidedata_offset)
                     new_sidedata = old_sidedata_file.read(sidedata_size)
                     new_sidedata_file.write(new_sidedata)
                 data_uncompressed_length = entry[ENTRY_DATA_UNCOMPRESSED_LENGTH]
                 sd_com_mode = entry[ENTRY_SIDEDATA_COMPRESSION_MODE]
                 assert data_delta_base <= rev, (data_delta_base, rev)
                 new_entry = revlogutils.entry(
                     flags=flags,
                     data_offset=new_data_offset,
                     data_compressed_length=new_data_size,
                     data_uncompressed_length=data_uncompressed_length,
                     data_delta_base=data_delta_base,
                     link_rev=entry[ENTRY_LINK_REV],
                     parent_rev_1=entry[ENTRY_PARENT_1],
                     parent_rev_2=entry[ENTRY_PARENT_2],
                     node_id=entry[ENTRY_NODE_ID],
                     sidedata_offset=new_sidedata_offset,
                     sidedata_compressed_length=sidedata_size,
                     data_compression_mode=d_comp_mode,
                     sidedata_compression_mode=sd_com_mode,
                 )
                 revlog.index.append(new_entry)
                 entry_bin = revlog.index.entry_binary(rev)
                 new_index_file.write(entry_bin)
                 revlog._docket.index_end = new_index_file.tell()
                 revlog._docket.data_end = new_data_file.tell()
                 revlog._docket.sidedata_end = new_sidedata_file.tell()
             def _rewrite_censor(
                 revlog,
                 old_index,
                 all_files,
                 rev,
                 tombstone,
             ):
                 """rewrite and append a censored revision"""
                 (
                     old_data_file,
                     old_sidedata_file,
                     new_index_file,
                     new_data_file,
                     new_sidedata_file,
                 ) = all_files
                 entry = old_index[rev]
                 # XXX consider trying the default compression too
                 new_data_size = len(tombstone)
                 new_data_offset = new_data_file.tell()
                 new_data_file.write(tombstone)
                 # we are not adding any sidedata as they might leak info about the censored version
                 link_rev = entry[ENTRY_LINK_REV]
                 p1 = entry[ENTRY_PARENT_1]
                 p2 = entry[ENTRY_PARENT_2]
                 new_entry = revlogutils.entry(
                     flags=constants.REVIDX_ISCENSORED,
                     data_offset=new_data_offset,
                     data_compressed_length=new_data_size,
                     data_uncompressed_length=new_data_size,
                     data_delta_base=rev,
                     link_rev=link_rev,
                     parent_rev_1=p1,
                     parent_rev_2=p2,
                     node_id=entry[ENTRY_NODE_ID],
                     sidedata_offset=0,
                     sidedata_compressed_length=0,
                     data_compression_mode=COMP_MODE_PLAIN,
                     sidedata_compression_mode=COMP_MODE_PLAIN,
                 )
                 revlog.index.append(new_entry)
                 entry_bin = revlog.index.entry_binary(rev)
                 new_index_file.write(entry_bin)
                 revlog._docket.index_end = new_index_file.tell()
                 revlog._docket.data_end = new_data_file.tell()
             def _get_filename_from_filelog_index(path):
                 # Drop the extension and the `data/` prefix
                 path_part = path.rsplit(b'.', 1)[0].split(b'/', 1)
                 if len(path_part) < 2:
                     msg = _(b"cannot recognize filelog from filename: '%s'")
                     msg %= path
                     raise error.Abort(msg)
                 return path_part[1]
             def _filelog_from_filename(repo, path):
                 """Returns the filelog for the given `path`. Stolen from `engine.py`"""
                 from .. import filelog  # avoid cycle
                 fl = filelog.filelog(repo.svfs, path)
                 return fl
             def _write_swapped_parents(repo, rl, rev, offset, fp):
                 """Swaps p1 and p2 and overwrites the revlog entry for `rev` in `fp`"""
                 from ..pure import parsers  # avoid cycle
                 if repo._currentlock(repo._lockref) is None:
                     # Let's be paranoid about it
                     msg = "repo needs to be locked to rewrite parents"
                     raise error.ProgrammingError(msg)
                 index_format = parsers.IndexObject.index_format
                 entry = rl.index[rev]
                 new_entry = list(entry)
                 new_entry[5], new_entry[6] = entry[6], entry[5]
                 packed = index_format.pack(*new_entry[:8])
                 fp.seek(offset)
                 fp.write(packed)
             def _reorder_filelog_parents(repo, fl, to_fix):
                 """
                 Swaps p1 and p2 for all `to_fix` revisions of filelog `fl` and writes the
                 new version to disk, overwriting the old one with a rename.
                 """
                 from ..pure import parsers  # avoid cycle
                 ui = repo.ui
                 assert len(to_fix) > 0
                 rl = fl._revlog
                 if rl._format_version != constants.REVLOGV1:
                     msg = "expected version 1 revlog, got version '%d'" % rl._format_version
                     raise error.ProgrammingError(msg)
                 index_file = rl._indexfile
                 new_file_path = index_file + b'.tmp-parents-fix'
                 repaired_msg = _(b"repaired revision %d of 'filelog %s'\n")
                 with ui.uninterruptible():
                     try:
                         util.copyfile(
                             rl.opener.join(index_file),
                             rl.opener.join(new_file_path),
                             checkambig=rl._checkambig,
                         )
                         with rl.opener(new_file_path, mode=b"r+") as fp:
                             if rl._inline:
                                 index = parsers.InlinedIndexObject(fp.read())
                                 for rev in fl.revs():
                                     if rev in to_fix:
                                         offset = index._calculate_index(rev)
                                         _write_swapped_parents(repo, rl, rev, offset, fp)
                                         ui.write(repaired_msg % (rev, index_file))
                             else:
                                 index_format = parsers.IndexObject.index_format
                                 for rev in to_fix:
                                     offset = rev * index_format.size
                                     _write_swapped_parents(repo, rl, rev, offset, fp)
                                     ui.write(repaired_msg % (rev, index_file))
                         rl.opener.rename(new_file_path, index_file)
                         rl.clearcaches()
                         rl._loadindex()
                     finally:
                         util.tryunlink(new_file_path)
             def _is_revision_affected(fl, filerev, metadata_cache=None):
                 full_text = lambda: fl._revlog.rawdata(filerev)
                 parent_revs = lambda: fl._revlog.parentrevs(filerev)
                 return _is_revision_affected_inner(
                     full_text, parent_revs, filerev, metadata_cache
                 )
             def _is_revision_affected_inner(
                 full_text,
                 parents_revs,
                 filerev,
                 metadata_cache=None,
             ):
                 """Mercurial currently (5.9rc0) uses `p1 == nullrev and p2 != nullrev` as a
                 special meaning compared to the reverse in the context of filelog-based
                 copytracing. issue6528 exists because new code assumed that parent ordering
                 didn't matter, so this detects if the revision contains metadata (since
                 it's only used for filelog-based copytracing) and its parents are in the
                 "wrong" order."""
                 try:
                     raw_text = full_text()
                 except error.CensoredNodeError:
                     # We don't care about censored nodes as they never carry metadata
                     return False
                 has_meta = raw_text.startswith(b'\x01\n')
                 if metadata_cache is not None:
                     metadata_cache[filerev] = has_meta
                 if has_meta:
                     (p1, p2) = parents_revs()
                     if p1 != nullrev and p2 == nullrev:
                         return True
                 return False
             def _is_revision_affected_fast(repo, fl, filerev, metadata_cache):
+                rl = fl._revlog
+                is_censored = lambda: rl.iscensored(filerev)
+                delta_base = lambda: rl.deltaparent(filerev)
+                delta = lambda: rl._chunk(filerev)
+                full_text = lambda: rl.rawdata(filerev)
+                parent_revs = lambda: rl.parentrevs(filerev)
+                return _is_revision_affected_fast_inner(
+                    is_censored,
+                    delta_base,
+                    delta,
+                    full_text,
+                    parent_revs,
+                    filerev,
+                    metadata_cache,
+                )
+            def _is_revision_affected_fast_inner(
+                is_censored,
+                delta_base,
+                delta,
+                full_text,
+                parent_revs,
+                filerev,
+                metadata_cache,
+            ):
                 """Optimization fast-path for `_is_revision_affected`.
                 `metadata_cache` is a dict of `{rev: has_metadata}` which allows any
                 revision to check if its base has metadata, saving computation of the full
                 text, instead looking at the current delta.
                 This optimization only works if the revisions are looked at in order."""
-                rl = fl._revlog
-                if rl.iscensored(filerev):
+                if is_censored():
                     # Censored revisions don't contain metadata, so they cannot be affected
                     metadata_cache[filerev] = False
                     return False
-                p1, p2 = rl.parentrevs(filerev)
+                p1, p2 = parent_revs()
                 if p1 == nullrev or p2 != nullrev:
                     return False
-                delta_parent = rl.deltaparent(filerev)
+                delta_parent = delta_base()
                 parent_has_metadata = metadata_cache.get(delta_parent)
                 if parent_has_metadata is None:
-                    is_affected = _is_revision_affected(fl, filerev, metadata_cache)
+                    return _is_revision_affected_inner(
-                    return is_affected
+                        full_text,
+                        parent_revs,
+                        filerev,
+                        metadata_cache,
+                    )
-                chunk = rl._chunk(filerev)
+                chunk = delta()
                 if not len(chunk):
                     # No diff for this revision
                     return parent_has_metadata
                 header_length = 12
                 if len(chunk) < header_length:
                     raise error.Abort(_(b"patch cannot be decoded"))
                 start, _end, _length = struct.unpack(b">lll", chunk[:header_length])
                 if start < 2:  # len(b'\x01\n') == 2
                     # This delta does *something* to the metadata marker (if any).
                     # Check it the slow way
-                    is_affected = _is_revision_affected(fl, filerev, metadata_cache)
+                    is_affected = _is_revision_affected_inner(
+                        full_text,
+                        parent_revs,
+                        filerev,
+                        metadata_cache,
+                    )
                     return is_affected
                 # The diff did not remove or add the metadata header, it's then in the same
                 # situation as its parent
                 metadata_cache[filerev] = parent_has_metadata
                 return parent_has_metadata
             def _from_report(ui, repo, context, from_report, dry_run):
                 """
                 Fix the revisions given in the `from_report` file, but still checks if the
                 revisions are indeed affected to prevent an unfortunate cyclic situation
                 where we'd swap well-ordered parents again.
                 See the doc for `debug_fix_issue6528` for the format documentation.
                 """
                 ui.write(_(b"loading report file '%s'\n") % from_report)
                 with context(), open(from_report, mode='rb') as f:
                     for line in f.read().split(b'\n'):
                         if not line:
                             continue
                         filenodes, filename = line.split(b' ', 1)
                         fl = _filelog_from_filename(repo, filename)
                         to_fix = set(
                             fl.rev(binascii.unhexlify(n)) for n in filenodes.split(b',')
                         )
                         excluded = set()
                         for filerev in to_fix:
                             if _is_revision_affected(fl, filerev):
                                 msg = b"found affected revision %d for filelog '%s'\n"
                                 ui.warn(msg % (filerev, filename))
                             else:
                                 msg = _(b"revision %s of file '%s' is not affected\n")
                                 msg %= (binascii.hexlify(fl.node(filerev)), filename)
                                 ui.warn(msg)
                                 excluded.add(filerev)
                         to_fix = to_fix - excluded
                         if not to_fix:
                             msg = _(b"no affected revisions were found for '%s'\n")
                             ui.write(msg % filename)
                             continue
                         if not dry_run:
                             _reorder_filelog_parents(repo, fl, sorted(to_fix))
             def repair_issue6528(
                 ui, repo, dry_run=False, to_report=None, from_report=None, paranoid=False
             ):
                 from .. import store  # avoid cycle
                 @contextlib.contextmanager
                 def context():
                     if dry_run or to_report:  # No need for locking
                         yield
                     else:
                         with repo.wlock(), repo.lock():
                             yield
                 if from_report:
                     return _from_report(ui, repo, context, from_report, dry_run)
                 report_entries = []
                 with context():
                     files = list(
                         (file_type, path)
                         for (file_type, path, _e, _s) in repo.store.datafiles()
                         if path.endswith(b'.i') and file_type & store.FILEFLAGS_FILELOG
                     )
                     progress = ui.makeprogress(
                         _(b"looking for affected revisions"),
                         unit=_(b"filelogs"),
                         total=len(files),
                     )
                     found_nothing = True
                     for file_type, path in files:
                         if (
                             not path.endswith(b'.i')
                             or not file_type & store.FILEFLAGS_FILELOG
                         ):
                             continue
                         progress.increment()
                         filename = _get_filename_from_filelog_index(path)
                         fl = _filelog_from_filename(repo, filename)
                         # Set of filerevs (or hex filenodes if `to_report`) that need fixing
                         to_fix = set()
                         metadata_cache = {}
                         for filerev in fl.revs():
                             affected = _is_revision_affected_fast(
                                 repo, fl, filerev, metadata_cache
                             )
                             if paranoid:
                                 slow = _is_revision_affected(fl, filerev)
                                 if slow != affected:
                                     msg = _(b"paranoid check failed for '%s' at node %s")
                                     node = binascii.hexlify(fl.node(filerev))
                                     raise error.Abort(msg % (filename, node))
                             if affected:
                                 msg = b"found affected revision %d for filelog '%s'\n"
                                 ui.warn(msg % (filerev, path))
                                 found_nothing = False
                                 if not dry_run:
                                     if to_report:
                                         to_fix.add(binascii.hexlify(fl.node(filerev)))
                                     else:
                                         to_fix.add(filerev)
                         if to_fix:
                             to_fix = sorted(to_fix)
                             if to_report:
                                 report_entries.append((filename, to_fix))
                             else:
                                 _reorder_filelog_parents(repo, fl, to_fix)
                     if found_nothing:
                         ui.write(_(b"no affected revisions were found\n"))
                     if to_report and report_entries:
                         with open(to_report, mode="wb") as f:
                             for path, to_fix in report_entries:
                                 f.write(b"%s %s\n" % (b",".join(to_fix), path))
                     progress.complete()