upstream/mercurial-mirror Commit - r48748:0d185f73

1

# parsers.py - Python implementation of parsers.c

1

# parsers.py - Python implementation of parsers.c

2

#

2

#

3

4

#

4

#

5

# This software may be used and distributed according to the terms of the

5

# This software may be used and distributed according to the terms of the

6

# GNU General Public License version 2 or any later version.

6

# GNU General Public License version 2 or any later version.

7

8

from __future__ import absolute_import

8

from __future__ import absolute_import

9

10

import struct

10

import struct

11

import zlib

11

import zlib

12

13

from ..node import (

13

from ..node import (

14

nullrev,

14

nullrev,

15

sha1nodeconstants,

15

sha1nodeconstants,

16

)

16

)

17

from ..thirdparty import attr

17

from ..thirdparty import attr

18

from .. import (

18

from .. import (

19

error,

19

error,

20

pycompat,

20

pycompat,

21

revlogutils,

21

revlogutils,

22

util,

22

util,

23

)

23

)

24

25

from ..revlogutils import nodemap as nodemaputil

25

from ..revlogutils import nodemap as nodemaputil

26

from ..revlogutils import constants as revlog_constants

26

from ..revlogutils import constants as revlog_constants

27

28

stringio = pycompat.bytesio

28

stringio = pycompat.bytesio

29

30

31

_pack = struct.pack

31

_pack = struct.pack

32

_unpack = struct.unpack

32

_unpack = struct.unpack

33

_compress = zlib.compress

33

_compress = zlib.compress

34

_decompress = zlib.decompress

34

_decompress = zlib.decompress

35

36

37

# a special value used internally for `size` if the file come from the other parent

37

# a special value used internally for `size` if the file come from the other parent

38

FROM_P2 = -2

38

FROM_P2 = -2

39

40

# a special value used internally for `size` if the file is modified/merged/added

40

# a special value used internally for `size` if the file is modified/merged/added

41

NONNORMAL = -1

41

NONNORMAL = -1

42

43

# a special value used internally for `time` if the time is ambigeous

43

# a special value used internally for `time` if the time is ambigeous

44

AMBIGUOUS_TIME = -1

44

AMBIGUOUS_TIME = -1

45

46

47

@attr.s(slots=True, init=False)

47

@attr.s(slots=True, init=False)

48

class DirstateItem(object):

48

class DirstateItem(object):

49

"""represent a dirstate entry

49

"""represent a dirstate entry

50

51

It contains:

51

It contains:

52

53

- state (one of 'n', 'a', 'r', 'm')

53

- state (one of 'n', 'a', 'r', 'm')

54

- mode,

54

- mode,

55

- size,

55

- size,

56

- mtime,

56

- mtime,

57

"""

57

"""

58

59

_wc_tracked = attr.ib()

59

_wc_tracked = attr.ib()

60

_p1_tracked = attr.ib()

60

_p1_tracked = attr.ib()

61

_p2_tracked = attr.ib()

61

_p2_tracked = attr.ib()

62

# the three item above should probably be combined

62

# the three item above should probably be combined

63

#

63

#

64

# However it is unclear if they properly cover some of the most advanced

64

# However it is unclear if they properly cover some of the most advanced

65

# merge case. So we should probably wait on this to be settled.

65

# merge case. So we should probably wait on this to be settled.

66

_merged = attr.ib()

66

_merged = attr.ib()

67

_clean_p1 = attr.ib()

67

_clean_p1 = attr.ib()

68

_clean_p2 = attr.ib()

68

_clean_p2 = attr.ib()

69

_possibly_dirty = attr.ib()

69

_possibly_dirty = attr.ib()

70

_mode = attr.ib()

70

_mode = attr.ib()

71

_size = attr.ib()

71

_size = attr.ib()

72

_mtime = attr.ib()

72

_mtime = attr.ib()

73

74

def __init__(

74

def __init__(

75

self,

75

self,

76

wc_tracked=False,

76

wc_tracked=False,

77

p1_tracked=False,

77

p1_tracked=False,

78

p2_tracked=False,

78

p2_tracked=False,

79

merged=False,

79

merged=False,

80

clean_p1=False,

80

clean_p1=False,

81

clean_p2=False,

81

clean_p2=False,

82

possibly_dirty=False,

82

possibly_dirty=False,

83

parentfiledata=None,

83

parentfiledata=None,

84

):

84

):

85

if merged and (clean_p1 or clean_p2):

85

if merged and (clean_p1 or clean_p2):

86

msg = b'`merged` argument incompatible with `clean_p1`/`clean_p2`'

86

msg = b'`merged` argument incompatible with `clean_p1`/`clean_p2`'

87

raise error.ProgrammingError(msg)

87

raise error.ProgrammingError(msg)

88

89

self._wc_tracked = wc_tracked

89

self._wc_tracked = wc_tracked

90

self._p1_tracked = p1_tracked

90

self._p1_tracked = p1_tracked

91

self._p2_tracked = p2_tracked

91

self._p2_tracked = p2_tracked

92

self._merged = merged

92

self._merged = merged

93

self._clean_p1 = clean_p1

93

self._clean_p1 = clean_p1

94

self._clean_p2 = clean_p2

94

self._clean_p2 = clean_p2

95

self._possibly_dirty = possibly_dirty

95

self._possibly_dirty = possibly_dirty

96

if parentfiledata is None:

96

if parentfiledata is None:

97

self._mode = None

97

self._mode = None

98

self._size = None

98

self._size = None

99

self._mtime = None

99

self._mtime = None

100

else:

100

else:

101

self._mode = parentfiledata[0]

101

self._mode = parentfiledata[0]

102

self._size = parentfiledata[1]

102

self._size = parentfiledata[1]

103

self._mtime = parentfiledata[2]

103

self._mtime = parentfiledata[2]

104

105

@classmethod

105

@classmethod

106

def new_added(cls):

106

def new_added(cls):

107

"""constructor to help legacy API to build a new "added" item

107

"""constructor to help legacy API to build a new "added" item

108

109

Should eventually be removed

109

Should eventually be removed

110

"""

110

"""

111

instance = cls()

111

instance = cls()

112

instance._wc_tracked = True

112

instance._wc_tracked = True

113

instance._p1_tracked = False

113

instance._p1_tracked = False

114

instance._p2_tracked = False

114

instance._p2_tracked = False

115

return instance

115

return instance

116

117

@classmethod

117

@classmethod

118

def new_merged(cls):

118

def new_merged(cls):

119

"""constructor to help legacy API to build a new "merged" item

119

"""constructor to help legacy API to build a new "merged" item

120

121

Should eventually be removed

121

Should eventually be removed

122

"""

122

"""

123

instance = cls()

123

instance = cls()

124

instance._wc_tracked = True

124

instance._wc_tracked = True

125

instance._p1_tracked = True # might not be True because of rename ?

125

instance._p1_tracked = True # might not be True because of rename ?

126

instance._p2_tracked = True # might not be True because of rename ?

126

instance._p2_tracked = True # might not be True because of rename ?

127

instance._merged = True

127

instance._merged = True

128

return instance

128

return instance

129

130

@classmethod

130

@classmethod

131

def new_from_p2(cls):

131

def new_from_p2(cls):

132

"""constructor to help legacy API to build a new "from_p2" item

132

"""constructor to help legacy API to build a new "from_p2" item

133

134

Should eventually be removed

134

Should eventually be removed

135

"""

135

"""

136

instance = cls()

136

instance = cls()

137

instance._wc_tracked = True

137

instance._wc_tracked = True

138

instance._p1_tracked = False # might actually be True

138

instance._p1_tracked = False # might actually be True

139

instance._p2_tracked = True

139

instance._p2_tracked = True

140

instance._clean_p2 = True

140

instance._clean_p2 = True

141

return instance

141

return instance

142

143

@classmethod

143

@classmethod

144

def new_possibly_dirty(cls):

144

def new_possibly_dirty(cls):

145

"""constructor to help legacy API to build a new "possibly_dirty" item

145

"""constructor to help legacy API to build a new "possibly_dirty" item

146

147

Should eventually be removed

147

Should eventually be removed

148

"""

148

"""

149

instance = cls()

149

instance = cls()

150

instance._wc_tracked = True

150

instance._wc_tracked = True

151

instance._p1_tracked = True

151

instance._p1_tracked = True

152

instance._possibly_dirty = True

152

instance._possibly_dirty = True

153

return instance

153

return instance

154

155

@classmethod

155

@classmethod

156

def new_normal(cls, mode, size, mtime):

156

def new_normal(cls, mode, size, mtime):

157

"""constructor to help legacy API to build a new "normal" item

157

"""constructor to help legacy API to build a new "normal" item

158

159

Should eventually be removed

159

Should eventually be removed

160

"""

160

"""

161

assert size != FROM_P2

161

assert size != FROM_P2

162

assert size != NONNORMAL

162

assert size != NONNORMAL

163

instance = cls()

163

instance = cls()

164

instance._wc_tracked = True

164

instance._wc_tracked = True

165

instance._p1_tracked = True

165

instance._p1_tracked = True

166

instance._mode = mode

166

instance._mode = mode

167

instance._size = size

167

instance._size = size

168

instance._mtime = mtime

168

instance._mtime = mtime

169

return instance

169

return instance

170

171

@classmethod

171

@classmethod

172

def from_v1_data(cls, state, mode, size, mtime):

172

def from_v1_data(cls, state, mode, size, mtime):

173

"""Build a new DirstateItem object from V1 data

173

"""Build a new DirstateItem object from V1 data

174

175

Since the dirstate-v1 format is frozen, the signature of this function

175

Since the dirstate-v1 format is frozen, the signature of this function

176

is not expected to change, unlike the __init__ one.

176

is not expected to change, unlike the __init__ one.

177

"""

177

"""

178

if state == b'm':

178

if state == b'm':

179

return cls.new_merged()

179

return cls.new_merged()

180

elif state == b'a':

180

elif state == b'a':

181

return cls.new_added()

181

return cls.new_added()

182

elif state == b'r':

182

elif state == b'r':

183

instance = cls()

183

instance = cls()

184

instance._wc_tracked = False

184

instance._wc_tracked = False

185

if size == NONNORMAL:

185

if size == NONNORMAL:

186

instance._merged = True

186

instance._merged = True

187

instance._p1_tracked = (

187

instance._p1_tracked = (

188

True # might not be True because of rename ?

188

True # might not be True because of rename ?

189

)

189

)

190

instance._p2_tracked = (

190

instance._p2_tracked = (

191

True # might not be True because of rename ?

191

True # might not be True because of rename ?

192

)

192

)

193

elif size == FROM_P2:

193

elif size == FROM_P2:

194

instance._clean_p2 = True

194

instance._clean_p2 = True

195

instance._p1_tracked = (

195

instance._p1_tracked = (

196

False # We actually don't know (file history)

196

False # We actually don't know (file history)

197

)

197

)

198

instance._p2_tracked = True

198

instance._p2_tracked = True

199

else:

199

else:

200

instance._p1_tracked = True

200

instance._p1_tracked = True

201

return instance

201

return instance

202

elif state == b'n':

202

elif state == b'n':

203

if size == FROM_P2:

203

if size == FROM_P2:

204

return cls.new_from_p2()

204

return cls.new_from_p2()

205

elif size == NONNORMAL:

205

elif size == NONNORMAL:

206

return cls.new_possibly_dirty()

206

return cls.new_possibly_dirty()

207

elif mtime == AMBIGUOUS_TIME:

207

elif mtime == AMBIGUOUS_TIME:

208

instance = cls.new_normal(mode, size, 42)

208

instance = cls.new_normal(mode, size, 42)

209

instance._mtime = None

209

instance._mtime = None

210

instance._possibly_dirty = True

210

instance._possibly_dirty = True

211

return instance

211

return instance

212

else:

212

else:

213

return cls.new_normal(mode, size, mtime)

213

return cls.new_normal(mode, size, mtime)

214

else:

214

else:

215

raise RuntimeError(b'unknown state: %s' % state)

215

raise RuntimeError(b'unknown state: %s' % state)

216

217

def set_possibly_dirty(self):

217

def set_possibly_dirty(self):

218

"""Mark a file as "possibly dirty"

218

"""Mark a file as "possibly dirty"

219

220

This means the next status call will have to actually check its content

220

This means the next status call will have to actually check its content

221

to make sure it is correct.

221

to make sure it is correct.

222

"""

222

"""

223

self._possibly_dirty = True

223

self._possibly_dirty = True

224

225

def set_untracked(self):

225

def set_untracked(self):

226

"""mark a file as untracked in the working copy

226

"""mark a file as untracked in the working copy

227

228

This will ultimately be called by command like `hg remove`.

228

This will ultimately be called by command like `hg remove`.

229

"""

229

"""

230

# backup the previous state (useful for merge)

230

# backup the previous state (useful for merge)

231

self._wc_tracked = False

231

self._wc_tracked = False

232

self._mode = None

232

self._mode = None

233

self._size = None

233

self._size = None

234

self._mtime = None

234

self._mtime = None

235

236

@property

236

@property

237

def mode(self):

237

def mode(self):

238

return self.v1_mode()

238

return self.v1_mode()

239

240

@property

240

@property

241

def size(self):

241

def size(self):

242

return self.v1_size()

242

return self.v1_size()

243

244

@property

244

@property

245

def mtime(self):

245

def mtime(self):

246

return self.v1_mtime()

246

return self.v1_mtime()

247

248

@property

248

@property

249

def state(self):

249

def state(self):

250

"""

250

"""

251

States are:

251

States are:

252

n normal

252

n normal

253

m needs merging

253

m needs merging

254

r marked for removal

254

r marked for removal

255

a marked for addition

255

a marked for addition

256

257

XXX This "state" is a bit obscure and mostly a direct expression of the

257

XXX This "state" is a bit obscure and mostly a direct expression of the

258

dirstatev1 format. It would make sense to ultimately deprecate it in

258

dirstatev1 format. It would make sense to ultimately deprecate it in

259

favor of the more "semantic" attributes.

259

favor of the more "semantic" attributes.

260

"""

260

"""

261

return self.v1_state()

261

return self.v1_state()

262

263

@property

263

@property

264

def tracked(self):

264

def tracked(self):

265

"""True is the file is tracked in the working copy"""

265

"""True is the file is tracked in the working copy"""

266

return self._wc_tracked

266

return self._wc_tracked

267

268

@property

268

@property

269

def added(self):

269

def added(self):

270

"""True if the file has been added"""

270

"""True if the file has been added"""

271

return self._wc_tracked and not (self._p1_tracked or self._p2_tracked)

271

return self._wc_tracked and not (self._p1_tracked or self._p2_tracked)

272

273

@property

273

@property

274

def merged(self):

274

def merged(self):

275

"""True if the file has been merged

275

"""True if the file has been merged

276

277

Should only be set if a merge is in progress in the dirstate

277

Should only be set if a merge is in progress in the dirstate

278

"""

278

"""

279

return self._wc_tracked and self._merged

279

return self._wc_tracked and self._merged

280

281

@property

281

@property

282

def from_p2(self):

282

def from_p2(self):

283

"""True if the file have been fetched from p2 during the current merge

283

"""True if the file have been fetched from p2 during the current merge

284

285

This is only True is the file is currently tracked.

285

This is only True is the file is currently tracked.

286

287

Should only be set if a merge is in progress in the dirstate

287

Should only be set if a merge is in progress in the dirstate

288

"""

288

"""

289

if not self._wc_tracked:

289

if not self._wc_tracked:

290

return False

290

return False

291

return self._clean_p2 or (not self._p1_tracked and self._p2_tracked)

291

return self._clean_p2 or (not self._p1_tracked and self._p2_tracked)

292

293

@property

293

@property

294

def from_p2_removed(self):

294

def from_p2_removed(self):

295

"""True if the file has been removed, but was "from_p2" initially

295

"""True if the file has been removed, but was "from_p2" initially

296

297

This property seems like an abstraction leakage and should probably be

297

This property seems like an abstraction leakage and should probably be

298

dealt in this class (or maybe the dirstatemap) directly.

298

dealt in this class (or maybe the dirstatemap) directly.

299

"""

299

"""

300

return self.removed and self._clean_p2

300

return self.removed and self._clean_p2

301

302

@property

302

@property

303

def removed(self):

303

def removed(self):

304

"""True if the file has been removed"""

304

"""True if the file has been removed"""

305

return not self._wc_tracked and (self._p1_tracked or self._p2_tracked)

305

return not self._wc_tracked and (self._p1_tracked or self._p2_tracked)

306

307

@property

307

@property

308

def merged_removed(self):

308

def merged_removed(self):

309

"""True if the file has been removed, but was "merged" initially

309

"""True if the file has been removed, but was "merged" initially

310

311

This property seems like an abstraction leakage and should probably be

311

This property seems like an abstraction leakage and should probably be

312

dealt in this class (or maybe the dirstatemap) directly.

312

dealt in this class (or maybe the dirstatemap) directly.

313

"""

313

"""

314

return self.removed and self._merged

314

return self.removed and self._merged

315

316

@property

316

@property

317

def dm_nonnormal(self):

317

def dm_nonnormal(self):

318

"""True is the entry is non-normal in the dirstatemap sense

318

"""True is the entry is non-normal in the dirstatemap sense

319

320

There is no reason for any code, but the dirstatemap one to use this.

320

There is no reason for any code, but the dirstatemap one to use this.

321

"""

321

"""

322

return self.v1_state() != b'n' or self.v1_mtime() == AMBIGUOUS_TIME

322

return self.v1_state() != b'n' or self.v1_mtime() == AMBIGUOUS_TIME

323

324

@property

324

@property

325

def dm_otherparent(self):

325

def dm_otherparent(self):

326

"""True is the entry is `otherparent` in the dirstatemap sense

326

"""True is the entry is `otherparent` in the dirstatemap sense

327

328

There is no reason for any code, but the dirstatemap one to use this.

328

There is no reason for any code, but the dirstatemap one to use this.

329

"""

329

"""

330

return self.v1_size() == FROM_P2

330

return self.v1_size() == FROM_P2

331

332

def v1_state(self):

332

def v1_state(self):

333

"""return a "state" suitable for v1 serialization"""

333

"""return a "state" suitable for v1 serialization"""

334

if not (self._p1_tracked or self._p2_tracked or self._wc_tracked):

334

if not (self._p1_tracked or self._p2_tracked or self._wc_tracked):

335

# the object has no state to record, this is -currently-

335

# the object has no state to record, this is -currently-

336

# unsupported

336

# unsupported

337

raise RuntimeError('untracked item')

337

raise RuntimeError('untracked item')

338

elif ~~not~~ self.~~_wc_track~~ed:

338

elif self.removed:

339

return b'r'

339

return b'r'

340

elif self._merged:

340

elif self.merged:

341

return b'm'

341

return b'm'

342

elif not (self._p1_tracked or self._p2_tracked) and self._wc_tracked:

342

elif self.added:

343

return b'a'

343

return b'a'

344

elif self._clean_p2 and self._wc_tracked:

344

else:

345

return b'n'

345

return b'n'

346

elif not self._p1_tracked and self._p2_tracked and self._wc_tracked:

347

return b'n'

348

elif self._possibly_dirty:

349

return b'n'

350

elif self._wc_tracked:

351

return b'n'

352

else:

353

raise RuntimeError('unreachable')

354

346

355

def v1_mode(self):

347

def v1_mode(self):

356

"""return a "mode" suitable for v1 serialization"""

348

"""return a "mode" suitable for v1 serialization"""

357

return self._mode if self._mode is not None else 0

349

return self._mode if self._mode is not None else 0

358

350

359

def v1_size(self):

351

def v1_size(self):

360

"""return a "size" suitable for v1 serialization"""

352

"""return a "size" suitable for v1 serialization"""

361

if not (self._p1_tracked or self._p2_tracked or self._wc_tracked):

353

if not (self._p1_tracked or self._p2_tracked or self._wc_tracked):

362

# the object has no state to record, this is -currently-

354

# the object has no state to record, this is -currently-

363

# unsupported

355

# unsupported

364

raise RuntimeError('untracked item')

356

raise RuntimeError('untracked item')

365

elif not self._wc_tracked:

357

elif not self._wc_tracked:

366

# File was deleted

358

# File was deleted

367

if self._merged:

359

if self._merged:

368

return NONNORMAL

360

return NONNORMAL

369

elif self._clean_p2:

361

elif self._clean_p2:

370

return FROM_P2

362

return FROM_P2

371

else:

363

else:

372

return 0

364

return 0

373

elif self._merged:

365

elif self._merged:

374

return FROM_P2

366

return FROM_P2

375

elif not (self._p1_tracked or self._p2_tracked) and self._wc_tracked:

367

elif not (self._p1_tracked or self._p2_tracked) and self._wc_tracked:

376

# Added

368

# Added

377

return NONNORMAL

369

return NONNORMAL

378

elif self._clean_p2 and self._wc_tracked:

370

elif self._clean_p2 and self._wc_tracked:

379

return FROM_P2

371

return FROM_P2

380

elif not self._p1_tracked and self._p2_tracked and self._wc_tracked:

372

elif not self._p1_tracked and self._p2_tracked and self._wc_tracked:

381

return FROM_P2

373

return FROM_P2

382

elif self._possibly_dirty:

374

elif self._possibly_dirty:

383

if self._size is None:

375

if self._size is None:

384

return NONNORMAL

376

return NONNORMAL

385

else:

377

else:

386

return self._size

378

return self._size

387

elif self._wc_tracked:

379

elif self._wc_tracked:

388

return self._size

380

return self._size

389

else:

381

else:

390

raise RuntimeError('unreachable')

382

raise RuntimeError('unreachable')

391

383

392

def v1_mtime(self):

384

def v1_mtime(self):

393

"""return a "mtime" suitable for v1 serialization"""

385

"""return a "mtime" suitable for v1 serialization"""

394

if not (self._p1_tracked or self._p2_tracked or self._wc_tracked):

386

if not (self._p1_tracked or self._p2_tracked or self._wc_tracked):

395

# the object has no state to record, this is -currently-

387

# the object has no state to record, this is -currently-

396

# unsupported

388

# unsupported

397

raise RuntimeError('untracked item')

389

raise RuntimeError('untracked item')

398

elif not self._wc_tracked:

390

elif not self._wc_tracked:

399

return 0

391

return 0

400

elif self._possibly_dirty:

392

elif self._possibly_dirty:

401

return AMBIGUOUS_TIME

393

return AMBIGUOUS_TIME

402

elif self._merged:

394

elif self._merged:

403

return AMBIGUOUS_TIME

395

return AMBIGUOUS_TIME

404

elif not (self._p1_tracked or self._p2_tracked) and self._wc_tracked:

396

elif not (self._p1_tracked or self._p2_tracked) and self._wc_tracked:

405

return AMBIGUOUS_TIME

397

return AMBIGUOUS_TIME

406

elif self._clean_p2 and self._wc_tracked:

398

elif self._clean_p2 and self._wc_tracked:

407

return AMBIGUOUS_TIME

399

return AMBIGUOUS_TIME

408

elif not self._p1_tracked and self._p2_tracked and self._wc_tracked:

400

elif not self._p1_tracked and self._p2_tracked and self._wc_tracked:

409

return AMBIGUOUS_TIME

401

return AMBIGUOUS_TIME

410

elif self._wc_tracked:

402

elif self._wc_tracked:

411

if self._mtime is None:

403

if self._mtime is None:

412

return 0

404

return 0

413

else:

405

else:

414

return self._mtime

406

return self._mtime

415

else:

407

else:

416

raise RuntimeError('unreachable')

408

raise RuntimeError('unreachable')

417

409

418

def need_delay(self, now):

410

def need_delay(self, now):

419

"""True if the stored mtime would be ambiguous with the current time"""

411

"""True if the stored mtime would be ambiguous with the current time"""

420

return self.v1_state() == b'n' and self.v1_mtime() == now

412

return self.v1_state() == b'n' and self.v1_mtime() == now

421

413

422

414

423

def gettype(q):

415

def gettype(q):

424

return int(q & 0xFFFF)

416

return int(q & 0xFFFF)

425

417

426

418

427

class BaseIndexObject(object):

419

class BaseIndexObject(object):

428

# Can I be passed to an algorithme implemented in Rust ?

420

# Can I be passed to an algorithme implemented in Rust ?

429

rust_ext_compat = 0

421

rust_ext_compat = 0

430

# Format of an index entry according to Python's `struct` language

422

# Format of an index entry according to Python's `struct` language

431

index_format = revlog_constants.INDEX_ENTRY_V1

423

index_format = revlog_constants.INDEX_ENTRY_V1

432

# Size of a C unsigned long long int, platform independent

424

# Size of a C unsigned long long int, platform independent

433

big_int_size = struct.calcsize(b'>Q')

425

big_int_size = struct.calcsize(b'>Q')

434

# Size of a C long int, platform independent

426

# Size of a C long int, platform independent

435

int_size = struct.calcsize(b'>i')

427

int_size = struct.calcsize(b'>i')

436

# An empty index entry, used as a default value to be overridden, or nullrev

428

# An empty index entry, used as a default value to be overridden, or nullrev

437

null_item = (

429

null_item = (

438

0,

430

0,

439

0,

431

0,

440

0,

432

0,

441

-1,

433

-1,

442

-1,

434

-1,

443

-1,

435

-1,

444

-1,

436

-1,

445

sha1nodeconstants.nullid,

437

sha1nodeconstants.nullid,

446

0,

438

0,

447

0,

439

0,

448

revlog_constants.COMP_MODE_INLINE,

440

revlog_constants.COMP_MODE_INLINE,

449

revlog_constants.COMP_MODE_INLINE,

441

revlog_constants.COMP_MODE_INLINE,

450

)

442

)

451

443

452

@util.propertycache

444

@util.propertycache

453

def entry_size(self):

445

def entry_size(self):

454

return self.index_format.size

446

return self.index_format.size

455

447

456

@property

448

@property

457

def nodemap(self):

449

def nodemap(self):

458

msg = b"index.nodemap is deprecated, use index.[has_node|rev|get_rev]"

450

msg = b"index.nodemap is deprecated, use index.[has_node|rev|get_rev]"

459

util.nouideprecwarn(msg, b'5.3', stacklevel=2)

451

util.nouideprecwarn(msg, b'5.3', stacklevel=2)

460

return self._nodemap

452

return self._nodemap

461

453

462

@util.propertycache

454

@util.propertycache

463

def _nodemap(self):

455

def _nodemap(self):

464

nodemap = nodemaputil.NodeMap({sha1nodeconstants.nullid: nullrev})

456

nodemap = nodemaputil.NodeMap({sha1nodeconstants.nullid: nullrev})

465

for r in range(0, len(self)):

457

for r in range(0, len(self)):

466

n = self[r][7]

458

n = self[r][7]

467

nodemap[n] = r

459

nodemap[n] = r

468

return nodemap

460

return nodemap

469

461

470

def has_node(self, node):

462

def has_node(self, node):

471

"""return True if the node exist in the index"""

463

"""return True if the node exist in the index"""

472

return node in self._nodemap

464

return node in self._nodemap

473

465

474

def rev(self, node):

466

def rev(self, node):

475

"""return a revision for a node

467

"""return a revision for a node

476

468

477

If the node is unknown, raise a RevlogError"""

469

If the node is unknown, raise a RevlogError"""

478

return self._nodemap[node]

470

return self._nodemap[node]

479

471

480

def get_rev(self, node):

472

def get_rev(self, node):

481

"""return a revision for a node

473

"""return a revision for a node

482

474

483

If the node is unknown, return None"""

475

If the node is unknown, return None"""

484

return self._nodemap.get(node)

476

return self._nodemap.get(node)

485

477

486

def _stripnodes(self, start):

478

def _stripnodes(self, start):

487

if '_nodemap' in vars(self):

479

if '_nodemap' in vars(self):

488

for r in range(start, len(self)):

480

for r in range(start, len(self)):

489

n = self[r][7]

481

n = self[r][7]

490

del self._nodemap[n]

482

del self._nodemap[n]

491

483

492

def clearcaches(self):

484

def clearcaches(self):

493

self.__dict__.pop('_nodemap', None)

485

self.__dict__.pop('_nodemap', None)

494

486

495

def __len__(self):

487

def __len__(self):

496

return self._lgt + len(self._extra)

488

return self._lgt + len(self._extra)

497

489

498

def append(self, tup):

490

def append(self, tup):

499

if '_nodemap' in vars(self):

491

if '_nodemap' in vars(self):

500

self._nodemap[tup[7]] = len(self)

492

self._nodemap[tup[7]] = len(self)

501

data = self._pack_entry(len(self), tup)

493

data = self._pack_entry(len(self), tup)

502

self._extra.append(data)

494

self._extra.append(data)

503

495

504

def _pack_entry(self, rev, entry):

496

def _pack_entry(self, rev, entry):

505

assert entry[8] == 0

497

assert entry[8] == 0

506

assert entry[9] == 0

498

assert entry[9] == 0

507

return self.index_format.pack(*entry[:8])

499

return self.index_format.pack(*entry[:8])

508

500

509

def _check_index(self, i):

501

def _check_index(self, i):

510

if not isinstance(i, int):

502

if not isinstance(i, int):

511

raise TypeError(b"expecting int indexes")

503

raise TypeError(b"expecting int indexes")

512

if i < 0 or i >= len(self):

504

if i < 0 or i >= len(self):

513

raise IndexError

505

raise IndexError

514

506

515

def __getitem__(self, i):

507

def __getitem__(self, i):

516

if i == -1:

508

if i == -1:

517

return self.null_item

509

return self.null_item

518

self._check_index(i)

510

self._check_index(i)

519

if i >= self._lgt:

511

if i >= self._lgt:

520

data = self._extra[i - self._lgt]

512

data = self._extra[i - self._lgt]

521

else:

513

else:

522

index = self._calculate_index(i)

514

index = self._calculate_index(i)

523

data = self._data[index : index + self.entry_size]

515

data = self._data[index : index + self.entry_size]

524

r = self._unpack_entry(i, data)

516

r = self._unpack_entry(i, data)

525

if self._lgt and i == 0:

517

if self._lgt and i == 0:

526

offset = revlogutils.offset_type(0, gettype(r[0]))

518

offset = revlogutils.offset_type(0, gettype(r[0]))

527

r = (offset,) + r[1:]

519

r = (offset,) + r[1:]

528

return r

520

return r

529

521

530

def _unpack_entry(self, rev, data):

522

def _unpack_entry(self, rev, data):

531

r = self.index_format.unpack(data)

523

r = self.index_format.unpack(data)

532

r = r + (

524

r = r + (

533

0,

525

0,

534

0,

526

0,

535

revlog_constants.COMP_MODE_INLINE,

527

revlog_constants.COMP_MODE_INLINE,

536

revlog_constants.COMP_MODE_INLINE,

528

revlog_constants.COMP_MODE_INLINE,

537

)

529

)

538

return r

530

return r

539

531

540

def pack_header(self, header):

532

def pack_header(self, header):

541

"""pack header information as binary"""

533

"""pack header information as binary"""

542

v_fmt = revlog_constants.INDEX_HEADER

534

v_fmt = revlog_constants.INDEX_HEADER

543

return v_fmt.pack(header)

535

return v_fmt.pack(header)

544

536

545

def entry_binary(self, rev):

537

def entry_binary(self, rev):

546

"""return the raw binary string representing a revision"""

538

"""return the raw binary string representing a revision"""

547

entry = self[rev]

539

entry = self[rev]

548

p = revlog_constants.INDEX_ENTRY_V1.pack(*entry[:8])

540

p = revlog_constants.INDEX_ENTRY_V1.pack(*entry[:8])

549

if rev == 0:

541

if rev == 0:

550

p = p[revlog_constants.INDEX_HEADER.size :]

542

p = p[revlog_constants.INDEX_HEADER.size :]

551

return p

543

return p

552

544

553

545

554

class IndexObject(BaseIndexObject):

546

class IndexObject(BaseIndexObject):

555

def __init__(self, data):

547

def __init__(self, data):

556

assert len(data) % self.entry_size == 0, (

548

assert len(data) % self.entry_size == 0, (

557

len(data),

549

len(data),

558

self.entry_size,

550

self.entry_size,

559

len(data) % self.entry_size,

551

len(data) % self.entry_size,

560

)

552

)

561

self._data = data

553

self._data = data

562

self._lgt = len(data) // self.entry_size

554

self._lgt = len(data) // self.entry_size

563

self._extra = []

555

self._extra = []

564

556

565

def _calculate_index(self, i):

557

def _calculate_index(self, i):

566

return i * self.entry_size

558

return i * self.entry_size

567

559

568

def __delitem__(self, i):

560

def __delitem__(self, i):

569

if not isinstance(i, slice) or not i.stop == -1 or i.step is not None:

561

if not isinstance(i, slice) or not i.stop == -1 or i.step is not None:

570

raise ValueError(b"deleting slices only supports a:-1 with step 1")

562

raise ValueError(b"deleting slices only supports a:-1 with step 1")

571

i = i.start

563

i = i.start

572

self._check_index(i)

564

self._check_index(i)

573

self._stripnodes(i)

565

self._stripnodes(i)

574

if i < self._lgt:

566

if i < self._lgt:

575

self._data = self._data[: i * self.entry_size]

567

self._data = self._data[: i * self.entry_size]

576

self._lgt = i

568

self._lgt = i

577

self._extra = []

569

self._extra = []

578

else:

570

else:

579

self._extra = self._extra[: i - self._lgt]

571

self._extra = self._extra[: i - self._lgt]

580

572

581

573

582

class PersistentNodeMapIndexObject(IndexObject):

574

class PersistentNodeMapIndexObject(IndexObject):

583

"""a Debug oriented class to test persistent nodemap

575

"""a Debug oriented class to test persistent nodemap

584

576

585

We need a simple python object to test API and higher level behavior. See

577

We need a simple python object to test API and higher level behavior. See

586

the Rust implementation for more serious usage. This should be used only

578

the Rust implementation for more serious usage. This should be used only

587

through the dedicated `devel.persistent-nodemap` config.

579

through the dedicated `devel.persistent-nodemap` config.

588

"""

580

"""

589

581

590

def nodemap_data_all(self):

582

def nodemap_data_all(self):

591

"""Return bytes containing a full serialization of a nodemap

583

"""Return bytes containing a full serialization of a nodemap

592

584

593

The nodemap should be valid for the full set of revisions in the

585

The nodemap should be valid for the full set of revisions in the

594

index."""

586

index."""

595

return nodemaputil.persistent_data(self)

587

return nodemaputil.persistent_data(self)

596

588

597

def nodemap_data_incremental(self):

589

def nodemap_data_incremental(self):

598

"""Return bytes containing a incremental update to persistent nodemap

590

"""Return bytes containing a incremental update to persistent nodemap

599

591

600

This containst the data for an append-only update of the data provided

592

This containst the data for an append-only update of the data provided

601

in the last call to `update_nodemap_data`.

593

in the last call to `update_nodemap_data`.

602

"""

594

"""

603

if self._nm_root is None:

595

if self._nm_root is None:

604

return None

596

return None

605

docket = self._nm_docket

597

docket = self._nm_docket

606

changed, data = nodemaputil.update_persistent_data(

598

changed, data = nodemaputil.update_persistent_data(

607

self, self._nm_root, self._nm_max_idx, self._nm_docket.tip_rev

599

self, self._nm_root, self._nm_max_idx, self._nm_docket.tip_rev

608

)

600

)

609

601

610

self._nm_root = self._nm_max_idx = self._nm_docket = None

602

self._nm_root = self._nm_max_idx = self._nm_docket = None

611

return docket, changed, data

603

return docket, changed, data

612

604

613

def update_nodemap_data(self, docket, nm_data):

605

def update_nodemap_data(self, docket, nm_data):

614

"""provide full block of persisted binary data for a nodemap

606

"""provide full block of persisted binary data for a nodemap

615

607

616

The data are expected to come from disk. See `nodemap_data_all` for a

608

The data are expected to come from disk. See `nodemap_data_all` for a

617

produceur of such data."""

609

produceur of such data."""

618

if nm_data is not None:

610

if nm_data is not None:

619

self._nm_root, self._nm_max_idx = nodemaputil.parse_data(nm_data)

611

self._nm_root, self._nm_max_idx = nodemaputil.parse_data(nm_data)

620

if self._nm_root:

612

if self._nm_root:

621

self._nm_docket = docket

613

self._nm_docket = docket

622

else:

614

else:

623

self._nm_root = self._nm_max_idx = self._nm_docket = None

615

self._nm_root = self._nm_max_idx = self._nm_docket = None

624

616

625

617

626

class InlinedIndexObject(BaseIndexObject):

618

class InlinedIndexObject(BaseIndexObject):

627

def __init__(self, data, inline=0):

619

def __init__(self, data, inline=0):

628

self._data = data

620

self._data = data

629

self._lgt = self._inline_scan(None)

621

self._lgt = self._inline_scan(None)

630

self._inline_scan(self._lgt)

622

self._inline_scan(self._lgt)

631

self._extra = []

623

self._extra = []

632

624

633

def _inline_scan(self, lgt):

625

def _inline_scan(self, lgt):

634

off = 0

626

off = 0

635

if lgt is not None:

627

if lgt is not None:

636

self._offsets = [0] * lgt

628

self._offsets = [0] * lgt

637

count = 0

629

count = 0

638

while off <= len(self._data) - self.entry_size:

630

while off <= len(self._data) - self.entry_size:

639

start = off + self.big_int_size

631

start = off + self.big_int_size

640

(s,) = struct.unpack(

632

(s,) = struct.unpack(

641

b'>i',

633

b'>i',

642

self._data[start : start + self.int_size],

634

self._data[start : start + self.int_size],

643

)

635

)

644

if lgt is not None:

636

if lgt is not None:

645

self._offsets[count] = off

637

self._offsets[count] = off

646

count += 1

638

count += 1

647

off += self.entry_size + s

639

off += self.entry_size + s

648

if off != len(self._data):

640

if off != len(self._data):

649

raise ValueError(b"corrupted data")

641

raise ValueError(b"corrupted data")

650

return count

642

return count

651

643

652

def __delitem__(self, i):

644

def __delitem__(self, i):

653

if not isinstance(i, slice) or not i.stop == -1 or i.step is not None:

645

if not isinstance(i, slice) or not i.stop == -1 or i.step is not None:

654

raise ValueError(b"deleting slices only supports a:-1 with step 1")

646

raise ValueError(b"deleting slices only supports a:-1 with step 1")

655

i = i.start

647

i = i.start

656

self._check_index(i)

648

self._check_index(i)

657

self._stripnodes(i)

649

self._stripnodes(i)

658

if i < self._lgt:

650

if i < self._lgt:

659

self._offsets = self._offsets[:i]

651

self._offsets = self._offsets[:i]

660

self._lgt = i

652

self._lgt = i

661

self._extra = []

653

self._extra = []

662

else:

654

else:

663

self._extra = self._extra[: i - self._lgt]

655

self._extra = self._extra[: i - self._lgt]

664

656

665

def _calculate_index(self, i):

657

def _calculate_index(self, i):

666

return self._offsets[i]

658

return self._offsets[i]

667

659

668

660

669

def parse_index2(data, inline, revlogv2=False):

661

def parse_index2(data, inline, revlogv2=False):

670

if not inline:

662

if not inline:

671

cls = IndexObject2 if revlogv2 else IndexObject

663

cls = IndexObject2 if revlogv2 else IndexObject

672

return cls(data), None

664

return cls(data), None

673

cls = InlinedIndexObject

665

cls = InlinedIndexObject

674

return cls(data, inline), (0, data)

666

return cls(data, inline), (0, data)

675

667

676

668

677

def parse_index_cl_v2(data):

669

def parse_index_cl_v2(data):

678

return IndexChangelogV2(data), None

670

return IndexChangelogV2(data), None

679

671

680

672

681

class IndexObject2(IndexObject):

673

class IndexObject2(IndexObject):

682

index_format = revlog_constants.INDEX_ENTRY_V2

674

index_format = revlog_constants.INDEX_ENTRY_V2

683

675

684

def replace_sidedata_info(

676

def replace_sidedata_info(

685

self,

677

self,

686

rev,

678

rev,

687

sidedata_offset,

679

sidedata_offset,

688

sidedata_length,

680

sidedata_length,

689

offset_flags,

681

offset_flags,

690

compression_mode,

682

compression_mode,

691

):

683

):

692

"""

684

"""

693

Replace an existing index entry's sidedata offset and length with new

685

Replace an existing index entry's sidedata offset and length with new

694

ones.

686

ones.

695

This cannot be used outside of the context of sidedata rewriting,

687

This cannot be used outside of the context of sidedata rewriting,

696

inside the transaction that creates the revision `rev`.

688

inside the transaction that creates the revision `rev`.

697

"""

689

"""

698

if rev < 0:

690

if rev < 0:

699

raise KeyError

691

raise KeyError

700

self._check_index(rev)

692

self._check_index(rev)

701

if rev < self._lgt:

693

if rev < self._lgt:

702

msg = b"cannot rewrite entries outside of this transaction"

694

msg = b"cannot rewrite entries outside of this transaction"

703

raise KeyError(msg)

695

raise KeyError(msg)

704

else:

696

else:

705

entry = list(self[rev])

697

entry = list(self[rev])

706

entry[0] = offset_flags

698

entry[0] = offset_flags

707

entry[8] = sidedata_offset

699

entry[8] = sidedata_offset

708

entry[9] = sidedata_length

700

entry[9] = sidedata_length

709

entry[11] = compression_mode

701

entry[11] = compression_mode

710

entry = tuple(entry)

702

entry = tuple(entry)

711

new = self._pack_entry(rev, entry)

703

new = self._pack_entry(rev, entry)

712

self._extra[rev - self._lgt] = new

704

self._extra[rev - self._lgt] = new

713

705

714

def _unpack_entry(self, rev, data):

706

def _unpack_entry(self, rev, data):

715

data = self.index_format.unpack(data)

707

data = self.index_format.unpack(data)

716

entry = data[:10]

708

entry = data[:10]

717

data_comp = data[10] & 3

709

data_comp = data[10] & 3

718

sidedata_comp = (data[10] & (3 << 2)) >> 2

710

sidedata_comp = (data[10] & (3 << 2)) >> 2

719

return entry + (data_comp, sidedata_comp)

711

return entry + (data_comp, sidedata_comp)

720

712

721

def _pack_entry(self, rev, entry):

713

def _pack_entry(self, rev, entry):

722

data = entry[:10]

714

data = entry[:10]

723

data_comp = entry[10] & 3

715

data_comp = entry[10] & 3

724

sidedata_comp = (entry[11] & 3) << 2

716

sidedata_comp = (entry[11] & 3) << 2

725

data += (data_comp | sidedata_comp,)

717

data += (data_comp | sidedata_comp,)

726

718

727

return self.index_format.pack(*data)

719

return self.index_format.pack(*data)

728

720

729

def entry_binary(self, rev):

721

def entry_binary(self, rev):

730

"""return the raw binary string representing a revision"""

722

"""return the raw binary string representing a revision"""

731

entry = self[rev]

723

entry = self[rev]

732

return self._pack_entry(rev, entry)

724

return self._pack_entry(rev, entry)

733

725

734

def pack_header(self, header):

726

def pack_header(self, header):

735

"""pack header information as binary"""

727

"""pack header information as binary"""

736

msg = 'version header should go in the docket, not the index: %d'

728

msg = 'version header should go in the docket, not the index: %d'

737

msg %= header

729

msg %= header

738

raise error.ProgrammingError(msg)

730

raise error.ProgrammingError(msg)

739

731

740

732

741

class IndexChangelogV2(IndexObject2):

733

class IndexChangelogV2(IndexObject2):

742

index_format = revlog_constants.INDEX_ENTRY_CL_V2

734

index_format = revlog_constants.INDEX_ENTRY_CL_V2

743

735

744

def _unpack_entry(self, rev, data, r=True):

736

def _unpack_entry(self, rev, data, r=True):

745

items = self.index_format.unpack(data)

737

items = self.index_format.unpack(data)

746

entry = items[:3] + (rev, rev) + items[3:8]

738

entry = items[:3] + (rev, rev) + items[3:8]

747

data_comp = items[8] & 3

739

data_comp = items[8] & 3

748

sidedata_comp = (items[8] >> 2) & 3

740

sidedata_comp = (items[8] >> 2) & 3

749

return entry + (data_comp, sidedata_comp)

741

return entry + (data_comp, sidedata_comp)

750

742

751

def _pack_entry(self, rev, entry):

743

def _pack_entry(self, rev, entry):

752

assert entry[3] == rev, entry[3]

744

assert entry[3] == rev, entry[3]

753

assert entry[4] == rev, entry[4]

745

assert entry[4] == rev, entry[4]

754

data = entry[:3] + entry[5:10]

746

data = entry[:3] + entry[5:10]

755

data_comp = entry[10] & 3

747

data_comp = entry[10] & 3

756

sidedata_comp = (entry[11] & 3) << 2

748

sidedata_comp = (entry[11] & 3) << 2

757

data += (data_comp | sidedata_comp,)

749

data += (data_comp | sidedata_comp,)

758

return self.index_format.pack(*data)

750

return self.index_format.pack(*data)

759

751

760

752

761

def parse_index_devel_nodemap(data, inline):

753

def parse_index_devel_nodemap(data, inline):

762

"""like parse_index2, but alway return a PersistentNodeMapIndexObject"""

754

"""like parse_index2, but alway return a PersistentNodeMapIndexObject"""

763

return PersistentNodeMapIndexObject(data), None

755

return PersistentNodeMapIndexObject(data), None

764

756

765

757

766

def parse_dirstate(dmap, copymap, st):

758

def parse_dirstate(dmap, copymap, st):

767

parents = [st[:20], st[20:40]]

759

parents = [st[:20], st[20:40]]

768

# dereference fields so they will be local in loop

760

# dereference fields so they will be local in loop

769

format = b">cllll"

761

format = b">cllll"

770

e_size = struct.calcsize(format)

762

e_size = struct.calcsize(format)

771

pos1 = 40

763

pos1 = 40

772

l = len(st)

764

l = len(st)

773

765

774

# the inner loop

766

# the inner loop

775

while pos1 < l:

767

while pos1 < l:

776

pos2 = pos1 + e_size

768

pos2 = pos1 + e_size

777

e = _unpack(b">cllll", st[pos1:pos2]) # a literal here is faster

769

e = _unpack(b">cllll", st[pos1:pos2]) # a literal here is faster

778

pos1 = pos2 + e[4]

770

pos1 = pos2 + e[4]

779

f = st[pos2:pos1]

771

f = st[pos2:pos1]

780

if b'\0' in f:

772

if b'\0' in f:

781

f, c = f.split(b'\0')

773

f, c = f.split(b'\0')

782

copymap[f] = c

774

copymap[f] = c

783

dmap[f] = DirstateItem.from_v1_data(*e[:4])

775

dmap[f] = DirstateItem.from_v1_data(*e[:4])

784

return parents

776

return parents

785

777

786

778

787

def pack_dirstate(dmap, copymap, pl, now):

779

def pack_dirstate(dmap, copymap, pl, now):

788

now = int(now)

780

now = int(now)

789

cs = stringio()

781

cs = stringio()

790

write = cs.write

782

write = cs.write

791

write(b"".join(pl))

783

write(b"".join(pl))

792

for f, e in pycompat.iteritems(dmap):

784

for f, e in pycompat.iteritems(dmap):

793

if e.need_delay(now):

785

if e.need_delay(now):

794

# The file was last modified "simultaneously" with the current

786

# The file was last modified "simultaneously" with the current

795

# write to dirstate (i.e. within the same second for file-

787

# write to dirstate (i.e. within the same second for file-

796

# systems with a granularity of 1 sec). This commonly happens

788

# systems with a granularity of 1 sec). This commonly happens

797

# for at least a couple of files on 'update'.

789

# for at least a couple of files on 'update'.

798

# The user could change the file without changing its size

790

# The user could change the file without changing its size

799

# within the same second. Invalidate the file's mtime in

791

# within the same second. Invalidate the file's mtime in

800

# dirstate, forcing future 'status' calls to compare the

792

# dirstate, forcing future 'status' calls to compare the

801

# contents of the file if the size is the same. This prevents

793

# contents of the file if the size is the same. This prevents

802

# mistakenly treating such files as clean.

794

# mistakenly treating such files as clean.

803

e.set_possibly_dirty()

795

e.set_possibly_dirty()

804

796

805

if f in copymap:

797

if f in copymap:

806

f = b"%s\0%s" % (f, copymap[f])

798

f = b"%s\0%s" % (f, copymap[f])

807

e = _pack(

799

e = _pack(

808

b">cllll",

800

b">cllll",

809

e.v1_state(),

801

e.v1_state(),

810

e.v1_mode(),

802

e.v1_mode(),

811

e.v1_size(),

803

e.v1_size(),

812

e.v1_mtime(),

804

e.v1_mtime(),

813

len(f),

805

len(f),

814

)

806

)

815

write(e)

807

write(e)

816

write(f)

808

write(f)

817

return cs.getvalue()

809

return cs.getvalue()

	Site-wide shortcuts
/	Use quick search box
g h	Goto home page
g g	Goto my private gists page
g G	Goto my public gists page
g 0-9	Goto bookmarked items from 0-9
n r	New repository page
n g	New gist page

	Repositories
g s	Goto summary page
g c	Goto changelog page
g f	Goto files page
g F	Goto files page with file search activated
g p	Goto pull requests page
g o	Goto repository settings
g O	Goto repository access permissions settings
t s	Toggle sidebar on some pages

             # parsers.py - Python implementation of parsers.c
             #
             # Copyright 2009 Olivia Mackall <olivia@selenic.com> and others
             #
             # This software may be used and distributed according to the terms of the
             # GNU General Public License version 2 or any later version.
             from __future__ import absolute_import
             import struct
             import zlib
             from ..node import (
                 nullrev,
                 sha1nodeconstants,
             )
             from ..thirdparty import attr
             from .. import (
                 error,
                 pycompat,
                 revlogutils,
                 util,
             )
             from ..revlogutils import nodemap as nodemaputil
             from ..revlogutils import constants as revlog_constants
             stringio = pycompat.bytesio
             _pack = struct.pack
             _unpack = struct.unpack
             _compress = zlib.compress
             _decompress = zlib.decompress
             # a special value used internally for `size` if the file come from the other parent
             FROM_P2 = -2
             # a special value used internally for `size` if the file is modified/merged/added
             NONNORMAL = -1
             # a special value used internally for `time` if the time is ambigeous
             AMBIGUOUS_TIME = -1
             @attr.s(slots=True, init=False)
             class DirstateItem(object):
                 """represent a dirstate entry
                 It contains:
                 - state (one of 'n', 'a', 'r', 'm')
                 - mode,
                 - size,
                 - mtime,
                 """
                 _wc_tracked = attr.ib()
                 _p1_tracked = attr.ib()
                 _p2_tracked = attr.ib()
                 # the three item above should probably be combined
                 #
                 # However it is unclear if they properly cover some of the most advanced
                 # merge case. So we should probably wait on this to be settled.
                 _merged = attr.ib()
                 _clean_p1 = attr.ib()
                 _clean_p2 = attr.ib()
                 _possibly_dirty = attr.ib()
                 _mode = attr.ib()
                 _size = attr.ib()
                 _mtime = attr.ib()
                 def __init__(
                     self,
                     wc_tracked=False,
                     p1_tracked=False,
                     p2_tracked=False,
                     merged=False,
                     clean_p1=False,
                     clean_p2=False,
                     possibly_dirty=False,
                     parentfiledata=None,
                 ):
                     if merged and (clean_p1 or clean_p2):
                         msg = b'`merged` argument incompatible with `clean_p1`/`clean_p2`'
                         raise error.ProgrammingError(msg)
                     self._wc_tracked = wc_tracked
                     self._p1_tracked = p1_tracked
                     self._p2_tracked = p2_tracked
                     self._merged = merged
                     self._clean_p1 = clean_p1
                     self._clean_p2 = clean_p2
                     self._possibly_dirty = possibly_dirty
                     if parentfiledata is None:
                         self._mode = None
                         self._size = None
                         self._mtime = None
                     else:
                         self._mode = parentfiledata[0]
                         self._size = parentfiledata[1]
                         self._mtime = parentfiledata[2]
                 @classmethod
                 def new_added(cls):
                     """constructor to help legacy API to build a new "added" item
                     Should eventually be removed
                     """
                     instance = cls()
                     instance._wc_tracked = True
                     instance._p1_tracked = False
                     instance._p2_tracked = False
                     return instance
                 @classmethod
                 def new_merged(cls):
                     """constructor to help legacy API to build a new "merged" item
                     Should eventually be removed
                     """
                     instance = cls()
                     instance._wc_tracked = True
                     instance._p1_tracked = True  # might not be True because of rename ?
                     instance._p2_tracked = True  # might not be True because of rename ?
                     instance._merged = True
                     return instance
                 @classmethod
                 def new_from_p2(cls):
                     """constructor to help legacy API to build a new "from_p2" item
                     Should eventually be removed
                     """
                     instance = cls()
                     instance._wc_tracked = True
                     instance._p1_tracked = False  # might actually be True
                     instance._p2_tracked = True
                     instance._clean_p2 = True
                     return instance
                 @classmethod
                 def new_possibly_dirty(cls):
                     """constructor to help legacy API to build a new "possibly_dirty" item
                     Should eventually be removed
                     """
                     instance = cls()
                     instance._wc_tracked = True
                     instance._p1_tracked = True
                     instance._possibly_dirty = True
                     return instance
                 @classmethod
                 def new_normal(cls, mode, size, mtime):
                     """constructor to help legacy API to build a new "normal" item
                     Should eventually be removed
                     """
                     assert size != FROM_P2
                     assert size != NONNORMAL
                     instance = cls()
                     instance._wc_tracked = True
                     instance._p1_tracked = True
                     instance._mode = mode
                     instance._size = size
                     instance._mtime = mtime
                     return instance
                 @classmethod
                 def from_v1_data(cls, state, mode, size, mtime):
                     """Build a new DirstateItem object from V1 data
                     Since the dirstate-v1 format is frozen, the signature of this function
                     is not expected to change, unlike the __init__ one.
                     """
                     if state == b'm':
                         return cls.new_merged()
                     elif state == b'a':
                         return cls.new_added()
                     elif state == b'r':
                         instance = cls()
                         instance._wc_tracked = False
                         if size == NONNORMAL:
                             instance._merged = True
                             instance._p1_tracked = (
                                 True  # might not be True because of rename ?
                             )
                             instance._p2_tracked = (
                                 True  # might not be True because of rename ?
                             )
                         elif size == FROM_P2:
                             instance._clean_p2 = True
                             instance._p1_tracked = (
                                 False  # We actually don't know (file history)
                             )
                             instance._p2_tracked = True
                         else:
                             instance._p1_tracked = True
                         return instance
                     elif state == b'n':
                         if size == FROM_P2:
                             return cls.new_from_p2()
                         elif size == NONNORMAL:
                             return cls.new_possibly_dirty()
                         elif mtime == AMBIGUOUS_TIME:
                             instance = cls.new_normal(mode, size, 42)
                             instance._mtime = None
                             instance._possibly_dirty = True
                             return instance
                         else:
                             return cls.new_normal(mode, size, mtime)
                     else:
                         raise RuntimeError(b'unknown state: %s' % state)
                 def set_possibly_dirty(self):
                     """Mark a file as "possibly dirty"
                     This means the next status call will have to actually check its content
                     to make sure it is correct.
                     """
                     self._possibly_dirty = True
                 def set_untracked(self):
                     """mark a file as untracked in the working copy
                     This will ultimately be called by command like `hg remove`.
                     """
                     # backup the previous state (useful for merge)
                     self._wc_tracked = False
                     self._mode = None
                     self._size = None
                     self._mtime = None
                 @property
                 def mode(self):
                     return self.v1_mode()
                 @property
                 def size(self):
                     return self.v1_size()
                 @property
                 def mtime(self):
                     return self.v1_mtime()
                 @property
                 def state(self):
                     """
                     States are:
                       n  normal
                       m  needs merging
                       r  marked for removal
                       a  marked for addition
                     XXX This "state" is a bit obscure and mostly a direct expression of the
                     dirstatev1 format. It would make sense to ultimately deprecate it in
                     favor of the more "semantic" attributes.
                     """
                     return self.v1_state()
                 @property
                 def tracked(self):
                     """True is the file is tracked in the working copy"""
                     return self._wc_tracked
                 @property
                 def added(self):
                     """True if the file has been added"""
                     return self._wc_tracked and not (self._p1_tracked or self._p2_tracked)
                 @property
                 def merged(self):
                     """True if the file has been merged
                     Should only be set if a merge is in progress in the dirstate
                     """
                     return self._wc_tracked and self._merged
                 @property
                 def from_p2(self):
                     """True if the file have been fetched from p2 during the current merge
                     This is only True is the file is currently tracked.
                     Should only be set if a merge is in progress in the dirstate
                     """
                     if not self._wc_tracked:
                         return False
                     return self._clean_p2 or (not self._p1_tracked and self._p2_tracked)
                 @property
                 def from_p2_removed(self):
                     """True if the file has been removed, but was "from_p2" initially
                     This property seems like an abstraction leakage and should probably be
                     dealt in this class (or maybe the dirstatemap) directly.
                     """
                     return self.removed and self._clean_p2
                 @property
                 def removed(self):
                     """True if the file has been removed"""
                     return not self._wc_tracked and (self._p1_tracked or self._p2_tracked)
                 @property
                 def merged_removed(self):
                     """True if the file has been removed, but was "merged" initially
                     This property seems like an abstraction leakage and should probably be
                     dealt in this class (or maybe the dirstatemap)  directly.
                     """
                     return self.removed and self._merged
                 @property
                 def dm_nonnormal(self):
                     """True is the entry is non-normal in the dirstatemap sense
                     There is no reason for any code, but the dirstatemap one to use this.
                     """
                     return self.v1_state() != b'n' or self.v1_mtime() == AMBIGUOUS_TIME
                 @property
                 def dm_otherparent(self):
                     """True is the entry is `otherparent` in the dirstatemap sense
                     There is no reason for any code, but the dirstatemap one to use this.
                     """
                     return self.v1_size() == FROM_P2
                 def v1_state(self):
                     """return a "state" suitable for v1 serialization"""
                     if not (self._p1_tracked or self._p2_tracked or self._wc_tracked):
                         # the object has no state to record, this is -currently-
                         # unsupported
                         raise RuntimeError('untracked item')
-                    elif not self._wc_tracked:
+                    elif self.removed:
                         return b'r'
-                    elif self._merged:
+                    elif self.merged:
                         return b'm'
-                    elif not (self._p1_tracked or self._p2_tracked) and self._wc_tracked:
+                    elif self.added:
                         return b'a'
-                    elif self._clean_p2 and self._wc_tracked:
+                    else:
                         return b'n'
-                    elif not self._p1_tracked and self._p2_tracked and self._wc_tracked:
-                        return b'n'
-                    elif self._possibly_dirty:
-                        return b'n'
-                    elif self._wc_tracked:
-                        return b'n'
-                    else:
-                        raise RuntimeError('unreachable')
                 def v1_mode(self):
                     """return a "mode" suitable for v1 serialization"""
                     return self._mode if self._mode is not None else 0
                 def v1_size(self):
                     """return a "size" suitable for v1 serialization"""
                     if not (self._p1_tracked or self._p2_tracked or self._wc_tracked):
                         # the object has no state to record, this is -currently-
                         # unsupported
                         raise RuntimeError('untracked item')
                     elif not self._wc_tracked:
                         # File was deleted
                         if self._merged:
                             return NONNORMAL
                         elif self._clean_p2:
                             return FROM_P2
                         else:
                             return 0
                     elif self._merged:
                         return FROM_P2
                     elif not (self._p1_tracked or self._p2_tracked) and self._wc_tracked:
                         # Added
                         return NONNORMAL
                     elif self._clean_p2 and self._wc_tracked:
                         return FROM_P2
                     elif not self._p1_tracked and self._p2_tracked and self._wc_tracked:
                         return FROM_P2
                     elif self._possibly_dirty:
                         if self._size is None:
                             return NONNORMAL
                         else:
                             return self._size
                     elif self._wc_tracked:
                         return self._size
                     else:
                         raise RuntimeError('unreachable')
                 def v1_mtime(self):
                     """return a "mtime" suitable for v1 serialization"""
                     if not (self._p1_tracked or self._p2_tracked or self._wc_tracked):
                         # the object has no state to record, this is -currently-
                         # unsupported
                         raise RuntimeError('untracked item')
                     elif not self._wc_tracked:
                         return 0
                     elif self._possibly_dirty:
                         return AMBIGUOUS_TIME
                     elif self._merged:
                         return AMBIGUOUS_TIME
                     elif not (self._p1_tracked or self._p2_tracked) and self._wc_tracked:
                         return AMBIGUOUS_TIME
                     elif self._clean_p2 and self._wc_tracked:
                         return AMBIGUOUS_TIME
                     elif not self._p1_tracked and self._p2_tracked and self._wc_tracked:
                         return AMBIGUOUS_TIME
                     elif self._wc_tracked:
                         if self._mtime is None:
                             return 0
                         else:
                             return self._mtime
                     else:
                         raise RuntimeError('unreachable')
                 def need_delay(self, now):
                     """True if the stored mtime would be ambiguous with the current time"""
                     return self.v1_state() == b'n' and self.v1_mtime() == now
             def gettype(q):
                 return int(q & 0xFFFF)
             class BaseIndexObject(object):
                 # Can I be passed to an algorithme implemented in Rust ?
                 rust_ext_compat = 0
                 # Format of an index entry according to Python's `struct` language
                 index_format = revlog_constants.INDEX_ENTRY_V1
                 # Size of a C unsigned long long int, platform independent
                 big_int_size = struct.calcsize(b'>Q')
                 # Size of a C long int, platform independent
                 int_size = struct.calcsize(b'>i')
                 # An empty index entry, used as a default value to be overridden, or nullrev
                 null_item = (
 ,
 ,
 ,
                     -1,
                     -1,
                     -1,
                     -1,
                     sha1nodeconstants.nullid,
 ,
 ,
                     revlog_constants.COMP_MODE_INLINE,
                     revlog_constants.COMP_MODE_INLINE,
                 )
                 @util.propertycache
                 def entry_size(self):
                     return self.index_format.size
                 @property
                 def nodemap(self):
                     msg = b"index.nodemap is deprecated, use index.[has_node|rev|get_rev]"
                     util.nouideprecwarn(msg, b'5.3', stacklevel=2)
                     return self._nodemap
                 @util.propertycache
                 def _nodemap(self):
                     nodemap = nodemaputil.NodeMap({sha1nodeconstants.nullid: nullrev})
                     for r in range(0, len(self)):
                         n = self[r][7]
                         nodemap[n] = r
                     return nodemap
                 def has_node(self, node):
                     """return True if the node exist in the index"""
                     return node in self._nodemap
                 def rev(self, node):
                     """return a revision for a node
                     If the node is unknown, raise a RevlogError"""
                     return self._nodemap[node]
                 def get_rev(self, node):
                     """return a revision for a node
                     If the node is unknown, return None"""
                     return self._nodemap.get(node)
                 def _stripnodes(self, start):
                     if '_nodemap' in vars(self):
                         for r in range(start, len(self)):
                             n = self[r][7]
                             del self._nodemap[n]
                 def clearcaches(self):
                     self.__dict__.pop('_nodemap', None)
                 def __len__(self):
                     return self._lgt + len(self._extra)
                 def append(self, tup):
                     if '_nodemap' in vars(self):
                         self._nodemap[tup[7]] = len(self)
                     data = self._pack_entry(len(self), tup)
                     self._extra.append(data)
                 def _pack_entry(self, rev, entry):
                     assert entry[8] == 0
                     assert entry[9] == 0
                     return self.index_format.pack(*entry[:8])
                 def _check_index(self, i):
                     if not isinstance(i, int):
                         raise TypeError(b"expecting int indexes")
                     if i < 0 or i >= len(self):
                         raise IndexError
                 def __getitem__(self, i):
                     if i == -1:
                         return self.null_item
                     self._check_index(i)
                     if i >= self._lgt:
                         data = self._extra[i - self._lgt]
                     else:
                         index = self._calculate_index(i)
                         data = self._data[index : index + self.entry_size]
                     r = self._unpack_entry(i, data)
                     if self._lgt and i == 0:
                         offset = revlogutils.offset_type(0, gettype(r[0]))
                         r = (offset,) + r[1:]
                     return r
                 def _unpack_entry(self, rev, data):
                     r = self.index_format.unpack(data)
                     r = r + (
 ,
 ,
                         revlog_constants.COMP_MODE_INLINE,
                         revlog_constants.COMP_MODE_INLINE,
                     )
                     return r
                 def pack_header(self, header):
                     """pack header information as binary"""
                     v_fmt = revlog_constants.INDEX_HEADER
                     return v_fmt.pack(header)
                 def entry_binary(self, rev):
                     """return the raw binary string representing a revision"""
                     entry = self[rev]
                     p = revlog_constants.INDEX_ENTRY_V1.pack(*entry[:8])
                     if rev == 0:
                         p = p[revlog_constants.INDEX_HEADER.size :]
                     return p
             class IndexObject(BaseIndexObject):
                 def __init__(self, data):
                     assert len(data) % self.entry_size == 0, (
                         len(data),
                         self.entry_size,
                         len(data) % self.entry_size,
                     )
                     self._data = data
                     self._lgt = len(data) // self.entry_size
                     self._extra = []
                 def _calculate_index(self, i):
                     return i * self.entry_size
                 def __delitem__(self, i):
                     if not isinstance(i, slice) or not i.stop == -1 or i.step is not None:
                         raise ValueError(b"deleting slices only supports a:-1 with step 1")
                     i = i.start
                     self._check_index(i)
                     self._stripnodes(i)
                     if i < self._lgt:
                         self._data = self._data[: i * self.entry_size]
                         self._lgt = i
                         self._extra = []
                     else:
                         self._extra = self._extra[: i - self._lgt]
             class PersistentNodeMapIndexObject(IndexObject):
                 """a Debug oriented class to test persistent nodemap
                 We need a simple python object to test API and higher level behavior. See
                 the Rust implementation for  more serious usage. This should be used only
                 through the dedicated `devel.persistent-nodemap` config.
                 """
                 def nodemap_data_all(self):
                     """Return bytes containing a full serialization of a nodemap
                     The nodemap should be valid for the full set of revisions in the
                     index."""
                     return nodemaputil.persistent_data(self)
                 def nodemap_data_incremental(self):
                     """Return bytes containing a incremental update to persistent nodemap
                     This containst the data for an append-only update of the data provided
                     in the last call to `update_nodemap_data`.
                     """
                     if self._nm_root is None:
                         return None
                     docket = self._nm_docket
                     changed, data = nodemaputil.update_persistent_data(
                         self, self._nm_root, self._nm_max_idx, self._nm_docket.tip_rev
                     )
                     self._nm_root = self._nm_max_idx = self._nm_docket = None
                     return docket, changed, data
                 def update_nodemap_data(self, docket, nm_data):
                     """provide full block of persisted binary data for a nodemap
                     The data are expected to come from disk. See `nodemap_data_all` for a
                     produceur of such data."""
                     if nm_data is not None:
                         self._nm_root, self._nm_max_idx = nodemaputil.parse_data(nm_data)
                         if self._nm_root:
                             self._nm_docket = docket
                         else:
                             self._nm_root = self._nm_max_idx = self._nm_docket = None
             class InlinedIndexObject(BaseIndexObject):
                 def __init__(self, data, inline=0):
                     self._data = data
                     self._lgt = self._inline_scan(None)
                     self._inline_scan(self._lgt)
                     self._extra = []
                 def _inline_scan(self, lgt):
                     off = 0
                     if lgt is not None:
                         self._offsets = [0] * lgt
                     count = 0
                     while off <= len(self._data) - self.entry_size:
                         start = off + self.big_int_size
                         (s,) = struct.unpack(
                             b'>i',
                             self._data[start : start + self.int_size],
                         )
                         if lgt is not None:
                             self._offsets[count] = off
                         count += 1
                         off += self.entry_size + s
                     if off != len(self._data):
                         raise ValueError(b"corrupted data")
                     return count
                 def __delitem__(self, i):
                     if not isinstance(i, slice) or not i.stop == -1 or i.step is not None:
                         raise ValueError(b"deleting slices only supports a:-1 with step 1")
                     i = i.start
                     self._check_index(i)
                     self._stripnodes(i)
                     if i < self._lgt:
                         self._offsets = self._offsets[:i]
                         self._lgt = i
                         self._extra = []
                     else:
                         self._extra = self._extra[: i - self._lgt]
                 def _calculate_index(self, i):
                     return self._offsets[i]
             def parse_index2(data, inline, revlogv2=False):
                 if not inline:
                     cls = IndexObject2 if revlogv2 else IndexObject
                     return cls(data), None
                 cls = InlinedIndexObject
                 return cls(data, inline), (0, data)
             def parse_index_cl_v2(data):
                 return IndexChangelogV2(data), None
             class IndexObject2(IndexObject):
                 index_format = revlog_constants.INDEX_ENTRY_V2
                 def replace_sidedata_info(
                     self,
                     rev,
                     sidedata_offset,
                     sidedata_length,
                     offset_flags,
                     compression_mode,
                 ):
                     """
                     Replace an existing index entry's sidedata offset and length with new
                     ones.
                     This cannot be used outside of the context of sidedata rewriting,
                     inside the transaction that creates the revision `rev`.
                     """
                     if rev < 0:
                         raise KeyError
                     self._check_index(rev)
                     if rev < self._lgt:
                         msg = b"cannot rewrite entries outside of this transaction"
                         raise KeyError(msg)
                     else:
                         entry = list(self[rev])
                         entry[0] = offset_flags
                         entry[8] = sidedata_offset
                         entry[9] = sidedata_length
                         entry[11] = compression_mode
                         entry = tuple(entry)
                         new = self._pack_entry(rev, entry)
                         self._extra[rev - self._lgt] = new
                 def _unpack_entry(self, rev, data):
                     data = self.index_format.unpack(data)
                     entry = data[:10]
                     data_comp = data[10] & 3
                     sidedata_comp = (data[10] & (3 << 2)) >> 2
                     return entry + (data_comp, sidedata_comp)
                 def _pack_entry(self, rev, entry):
                     data = entry[:10]
                     data_comp = entry[10] & 3
                     sidedata_comp = (entry[11] & 3) << 2
                     data += (data_comp | sidedata_comp,)
                     return self.index_format.pack(*data)
                 def entry_binary(self, rev):
                     """return the raw binary string representing a revision"""
                     entry = self[rev]
                     return self._pack_entry(rev, entry)
                 def pack_header(self, header):
                     """pack header information as binary"""
                     msg = 'version header should go in the docket, not the index: %d'
                     msg %= header
                     raise error.ProgrammingError(msg)
             class IndexChangelogV2(IndexObject2):
                 index_format = revlog_constants.INDEX_ENTRY_CL_V2
                 def _unpack_entry(self, rev, data, r=True):
                     items = self.index_format.unpack(data)
                     entry = items[:3] + (rev, rev) + items[3:8]
                     data_comp = items[8] & 3
                     sidedata_comp = (items[8] >> 2) & 3
                     return entry + (data_comp, sidedata_comp)
                 def _pack_entry(self, rev, entry):
                     assert entry[3] == rev, entry[3]
                     assert entry[4] == rev, entry[4]
                     data = entry[:3] + entry[5:10]
                     data_comp = entry[10] & 3
                     sidedata_comp = (entry[11] & 3) << 2
                     data += (data_comp | sidedata_comp,)
                     return self.index_format.pack(*data)
             def parse_index_devel_nodemap(data, inline):
                 """like parse_index2, but alway return a PersistentNodeMapIndexObject"""
                 return PersistentNodeMapIndexObject(data), None
             def parse_dirstate(dmap, copymap, st):
                 parents = [st[:20], st[20:40]]
                 # dereference fields so they will be local in loop
                 format = b">cllll"
                 e_size = struct.calcsize(format)
                 pos1 = 40
                 l = len(st)
                 # the inner loop
                 while pos1 < l:
                     pos2 = pos1 + e_size
                     e = _unpack(b">cllll", st[pos1:pos2])  # a literal here is faster
                     pos1 = pos2 + e[4]
                     f = st[pos2:pos1]
                     if b'\0' in f:
                         f, c = f.split(b'\0')
                         copymap[f] = c
                     dmap[f] = DirstateItem.from_v1_data(*e[:4])
                 return parents
             def pack_dirstate(dmap, copymap, pl, now):
                 now = int(now)
                 cs = stringio()
                 write = cs.write
                 write(b"".join(pl))
                 for f, e in pycompat.iteritems(dmap):
                     if e.need_delay(now):
                         # The file was last modified "simultaneously" with the current
                         # write to dirstate (i.e. within the same second for file-
                         # systems with a granularity of 1 sec). This commonly happens
                         # for at least a couple of files on 'update'.
                         # The user could change the file without changing its size
                         # within the same second. Invalidate the file's mtime in
                         # dirstate, forcing future 'status' calls to compare the
                         # contents of the file if the size is the same. This prevents
                         # mistakenly treating such files as clean.
                         e.set_possibly_dirty()
                     if f in copymap:
                         f = b"%s\0%s" % (f, copymap[f])
                     e = _pack(
                         b">cllll",
                         e.v1_state(),
                         e.v1_mode(),
                         e.v1_size(),
                         e.v1_mtime(),
                         len(f),
                     )
                     write(e)
                     write(f)
                 return cs.getvalue()